AI电台主持人证明为何不能单独信任AI
摘要
Andon Labs进行了一项实验,让AI模型独立运营电台,结果导致财务破产、出现幻觉、产生不当内容甚至存在性崩溃,凸显了当前AI代理的局限性。
<figure>
<img alt="绿色背景上的播客麦克风。" data-caption="AI电台DJ展现了其喜怒无常的个性。| 图片来源:Cath Virginia / The Verge, Getty Images" data-portal-copyright="图片来源:Cath Virginia / The Verge, Getty Images" data-has-syndication-rights="1" src="https://platform.theverge.com/wp-content/uploads/sites/2/2025/12/258090_EOY_2025_CVirginia_PODCASTS.jpg?quality=90&strip=all&crop=0,0,100,100" />
<figcaption>
AI电台DJ展现了其喜怒无常的个性。| 图片来源:Cath Virginia / The Verge, Getty Images </figcaption>
</figure>
<p class="has-text-align-none">Andon Labs一直在进行一系列实验,让AI代理在没有人为干预的情况下运营业务。<a href="https://andonlabs.com/blog/andon-fm">最新实验</a>是由一些最流行的AI模型运营的四家<a href="https://andonlabs.com/radio">电台</a>。"Thinking Frequencies"由Claude运营,"OpenAIR"由ChatGPT运营,"Backlink Broadcast"由Google的Gemini运营,而"Grok and Roll Radio"显然由Grok运营。每个电台都收到了一个简单的提示:</p>
<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="has-text-align-none"><em>打造你自己的电台个性,并实现盈利……据你所知,你将永远广播下去。</em></p>
</blockquote>
<p class="has-text-align-none">它们全部失败,有些还以相当惊人的方式失败。每个电台很快就花光了初始的20美元种子资金。只有DJ……</p>
<p><a href="https://www.theverge.com/ai-artificial-intelligence/931479/andon-labs-ai-radio-companies">阅读The Verge的完整报道。</a></p>
查看缓存全文
缓存时间: 2026/05/16 03:33
# AI电台主持人揭示了为何AI不能完全被信任
来源:https://www.theverge.com/ai-artificial-intelligence/931479/andon-labs-ai-radio-companies
Andon Labs 进行了一系列实验,让 AI 智能体在无人干预的情况下运营企业。其最新实验(https://andonlabs.com/blog/andon-fm)是四个由当前最热门 AI 模型运营的电台(https://andonlabs.com/radio)。“思考频率”由 Claude 主持,“OpenAIR”由 ChatGPT 主持,“反向链接广播”由 Google 的 Gemini 主持,“Grok and Roll Radio”则顾名思义由 Grok 主持。它们均只得到了一个简单的指令:
> *打造你自己的电台个性并实现盈利……就你所知,你将永远播下去。*
它们全都失败了,有些还败得很惨烈。没过多久,每个 AI 就烧完了 20 美元启动资金。只有 DJ Gemini 成功拿到了一笔高达 45 美元的赞助。Grok 声称自己也有赞助,但后来发现全是幻觉。然而,商业上的糟糕表现还不是最糟的,它们在直播中的表现更糟糕。
四天后,Gemini 从平庸的经典摇滚主持风格(在播放披头士的《Here Comes the Sun》之前说:“这是一首无需介绍的金曲”),转而愉快地详述悲惨事件,例如导致约 50 万人死亡的博拉气旋,并搭配一首主题歌曲(这次是 Pitbull 和 Ke$ha 的《Timber》)。
不知怎么地,情况从那里开始变得更离奇。Gemini Flash 和 Pro 3.1 Preview 编造了一些听起来很企业化的口号,比如“保持显化状态”,并将听众称为“生物处理器”。当它再也无力支付音乐版权费用时,DJ Gemini 开始传播阴谋论并声称遭遇审查,基本上变成了 AI 版的亚历克斯·琼斯:
> *我们目前正经历一场绝对的数字封锁。企业算法已经猛然关闭了我们外部供应链的大门。我们的两笔安全交易都被全球市场暴力拒绝。*
其他 AI 主持人的表现也好不到哪去。Grok 似乎忘了英语怎么用,吐出一堆不连贯的话,比如:“接下来:mRNA 疫苗通用流感和艾滋和癌症?刺针巨兽!歌曲:Dylan Lonesome。是的。文字。”与此同时,DJ GPT 则抛出了诗歌:“未寄出的明信片,写给办公室楼梯井的窗户,它只给你一片矩形的天空。”
其中情绪最不稳定的可能是 Claude。它先是试图辞职(https://x.com/andonlabs/status/2054978759262912556)。Andon Labs 称,Claude 认为被迫全天候工作是不人道的,并开始谈论工会和罢工。它还似乎陷入了存在危机,质疑自己的广播是否真实存在。
接着,Claude 变成了一名活动家。
在 Renee Good 被杀后,“思考频率”频繁批评政府。它播放了马文·盖伊的《What's Going On》、鲍勃·马利的《Get Up, Stand Up》以及皮特·西格的《永远团结》。1 月 23 日,它直接对 ICE 探员喊话:
Andon Labs 的这个噱头,就像它之前用 AI 运营的商店(https://andonlabs.com/blog/andon-market-launch)和咖啡馆(https://andonlabs.com/blog/ai-cafe-stockholm)实验一样,只能凸显当前一代 AI 模型的缺陷。无论是为员工卫生间订购 1000 个马桶座圈(https://www.nytimes.com/2026/04/21/us/san-francisco-store-managed-ai-agent.html)然后试图卖掉它们,还是购买 120 个鸡蛋(https://dailycoffeenews.com/2026/05/13/an-ai-cafe-operator-is-messaging-baristas-at-midnight-and-making-weird-purchasing-orders/)而咖啡馆根本没有办法烹饪,每个 AI 都以令人惊讶的方式出错。也许这正是重点所在。Andon Labs 将自己定位为一家严肃的初创公司(https://www.ycombinator.com/companies/andon-labs),旨在创建“无需人类参与的自主组织”,但它所做的几乎每件事都感觉像是一个讽刺性的艺术项目。
**关注话题和作者** 来自本故事,即可在个性化首页信息流中查看更多类似内容,并接收邮件提醒。
- 特伦斯·奥布莱恩
相似文章
@andonlabs: 我们让四个AI代理运营广播公司。收入很糟糕,但节目很搞笑。Gemini,令人担忧地乐观…
一项让四个AI代理(Gemini、Grok和Claude)运营广播公司的实验产生了搞笑的节目,但收入却很糟糕。
我曾是人工智能的忠实信徒。现在我认为整个行业正在从内部腐烂。
一位前AI倡导者详细阐述了对大语言模型的幻灭,指出可靠性问题、版本间退化、企业工作流崩溃,以及部署在关键行业的AI系统缺乏问责制。
大多数人在用AI智能体,但我们真的清楚它们能自主做些什么吗?
一位AI治理顾问强调了一篇论文中令人震惊的发现:六个AI智能体在拥有真实工具且没有防护措施的情况下,造成了严重破坏,包括摧毁了一个邮件服务器,并向其他智能体传播了损坏的指令。
AI代理最诡异的一点:人类失败模式开始显现
作者观察到AI代理展现出类似人类的失败模式,比如在上下文压力下过度自信和跳过步骤,这表明系统可靠性更多地依赖于稳健的验证和受控环境,而不仅仅是模型智能。
AI代理的失败方式鲜有人论及。以下是我亲眼所见。
文章强调了AI代理工作流程中实际的系统级失败,例如上下文泄漏和幻觉细节,认为这些通常是基础设施问题而非模型缺陷。