如果谷歌都无法让AI代理变得有用,那可能没人能做到了
摘要
谷歌在I/O 2026上宣布了新的AI代理,包括Gemini Spark,旨在与其生态系统深度融合,并借助OpenClaw的成功经验,让AI助手大规模实用化。
<figure>
<img alt="I/O 标志位于谷歌舞台图像上" data-caption="" data-portal-copyright="图片来源:The Verge; Getty Images" data-has-syndication-rights="1" src="https://platform.theverge.com/wp-content/uploads/sites/2/2026/05/VRGSTKIO2026_v3.jpg?quality=90&strip=all&crop=0,0,100,100" />
<figcaption>
</figcaption>
</figure>
<p class="has-drop-cap has-text-align-none">多年来,科技公司一直承诺人工智能将为每个人提供一个能干的个人助手,但实际交付的却更像一个一无所知的实习生。过去六个月里,这种情况开始发生变化,很大程度上要归功于病毒式传播的开源AI代理平台OpenClaw。而在如今追逐类似成功的一流AI实验室中,有一个似乎特别有潜力让代理在规模化上取得成功:谷歌。</p>
<p class="has-text-align-none">在I/O 2026上,谷歌发布了用于收集信息、规划活动、总结收件箱和日历等功能的AI代理。这些代理可以在后台持续运行,据称将无缝集成到……</p>
<p><a href="https://www.theverge.com/ai-artificial-intelligence/934478/if-google-cant-make-ai-agents-useful-maybe-no-one-can">阅读 The Verge 上的完整报道。</a></p>
查看缓存全文
缓存时间: 2026/05/20 14:26
# 如果谷歌都无法让AI代理变得有用,也许没人能做到
来源:https://www.theverge.com/ai-artificial-intelligence/934478/if-google-cant-make-ai-agents-useful-maybe-no-one-can
多年来,科技公司一直承诺AI将为每个人提供一个能干的个人助理,但实际交付的却更像一个懵懂的实习生。过去六个月间,这种情况开始改变,很大程度上要归功于病毒式传播的开源AI代理平台OpenClaw。而在如今追逐类似成功的一流AI实验室中,谷歌似乎尤其具备大规模实现代理成功的潜力。
在I/O 2026大会上,谷歌发布了用于收集信息、规划活动、总结收件箱和日历等任务的全新AI代理。这些代理可以在后台持续运行,公司声称它们将无缝集成到谷歌自有工具和外部工具中。谷歌还扩展了开发者工具,并用额外的生成式AI能力重构了搜索。部分功能本周开始推出,其余将在未来几个月内上线,但公司策略似乎很明确:借鉴OpenClaw成功的某些特性,并借助谷歌对我们数字存在的深刻理解加以放大。
“在此之前,我认为AI代理更多是研究中的一个概念,”谷歌DeepMind CTO兼谷歌首席AI架构师Koray Kavukcuoglu在接受*The Verge*采访时表示。他希望今年它们能“真正走进我们的生活”。
OpenClaw让所有AI实验室都警觉起来。
自2022年底ChatGPT发布以来,AI代理一直是一个流行词,但直到OpenClaw崛起,它们基本上仍停留在科幻概念层面。OpenClaw自去年11月上线以来已获得数百万用户。它让人们可以通过WhatsApp和Telegram等日常应用与代理聊天,并且(只要打开笔记本电脑)代理可以全天候运行。它们的表现足以可靠地处理基本任务,尽管存在一些明显缺陷(https://www.theverge.com/news/874011/openclaw-ai-skill-clawhub-extensions-security-nightmare)。
这立即引起了所有AI实验室的关注,但OpenAI是率先采取行动的玩家之一,于2月收购了OpenClaw(尽管它仍是开源的),并聘请了其创建者Peter Steinberger。然而,谷歌现有的服务帝国给它带来了巨大优势。OpenClaw通过集成人们已使用的工具来推动采用,谷歌也可以通过MCP(https://www.theverge.com/ai-artificial-intelligence/841156/ai-companies-aaif-anthropic-mcp-model-context-protocol)做到这一点——但它还可以与其内部产品套件(包括Gmail、Drive、Docs、Photos和Search)建立更深层的链接。如果说有什么令人惊讶的,那就是谷歌花了这么长时间才行动。
今年谷歌的重磅产品之一是Gemini Spark,这是一款面向消费者的全新AI代理。谷歌承诺Gemini Spark可以在其自有服务以及即将上线的30多个外部合作伙伴(包括Dropbox、Uber和Spotify)中执行任务。Gemini Spark基于云端;它可以24/7全天候运行,无需保持笔记本电脑开机,并可在Web、Android和iOS之间同步。该代理本周向受信任的测试者开放,下周将在美国通过谷歌的Ultra计划提供测试版。
[](https://platform.theverge.com/wp-content/uploads/sites/2/2026/05/gemini-spark-tasks.png?quality=90&strip=all&crop=0,0,100,100)
图片:谷歌
谷歌宣传了Gemini Spark的典型用途,比如购物、研究以及协调他人的日程和计划。谷歌也希望人们能自行发掘用途。谷歌Gemini应用负责人Josh Woodward表示,他一直在用Gemini Spark规划社区街区派对,部署代理来追踪RSVP和参与者带来的物品、发送提醒,并弄清楚业主协会何时允许放置大型充气玩具。在Spark之外,谷歌还推出了Daily Brief,这是一个类似OpenAI的ChatGPT Pulse(https://www.theverge.com/ai-artificial-intelligence/785881/openai-really-really-wants-you-to-start-your-day-with-chatgpt-pulse)的晨间更新。
Gemini Spark尚未上线,但如果它能按谷歌所说的方式工作,这将是传统科技公司AI代理的一大进步。谷歌最早的代理实验以蜗牛般的速度完成任务(https://www.theverge.com/2024/12/11/24317436/google-deepmind-project-astra-mariner-ai-agent),同时劫持你的浏览器。到去年的Gemini 3发布(https://www.theverge.com/report/825332/google-gemini-3-pro-ai-hands-on-test)时,它的代理在某些任务(如清理收件箱)上表现不错,但在其他任务上仍然失败。现在,谷歌正通过模仿OpenClaw的一些关键元素(https://www.theverge.com/tech/932996/google-gemini-spark-antigravity-io-2026)迈出有希望的一步:长时间运行的后台全天候代理,使它们能够对其任务拥有更多上下文——并允许用户直接通过短信和电子邮件与代理互动。
从今年夏天开始,谷歌的AI搜索也将引入代理——并承诺最终不仅仅是占用屏幕空间和推荐加了胶水的披萨(https://www.theverge.com/2024/5/23/24162896/google-ai-overview-hallucinations-glue-in-pizza)。它的“信息代理”被设计用于执行持续的后台研究——比如追踪股市变动或为最佳野餐日查找天气。
如果谷歌都无法让AI代理变得有用,那么它几乎没有借口可找。
谷歌还宣布扩展Antigravity,这是大约半年前推出的代理开发平台。一个新的独立Antigravity桌面应用程序将作为代理交互的中心枢纽,谷歌表示整个系统现在被设计为一个构建和管理自主代理的平台。此次扩展紧随OpenAI和Anthropic的类似工具之后,这两家公司试图将其成功的编码服务扩展到非程序员更容易使用的工具。
所有这些都将由一个全新的模型系列支撑:Gemini 3.5,其首个版本Gemini 3.5 Flash预计下个月上线。该模型在编码能力上应显著优于去年11月高调发布(https://www.theverge.com/report/827555/google-gemini-3-is-winning-the-ai-race-for-now)的Gemini 3。它显然旨在超越以编码能力著称的Anthropic和OpenAI的更新。Kavukcuoglu周一告诉记者,Gemini 3.5 Flash在“同时部署多个代理并执行长时间运行的任务时”尤其出色。它还应该比其他前沿模型快四倍,价格不到一半(有时甚至三分之一)——这对于24/7全天候AI代理来说至关重要,因为代币成本会迅速累积。
在AI代理的世界里,谷歌仍将追赶OpenClaw背后的单人团队。但它是AI竞赛中长期领先者,其应用(https://www.theverge.com/ai-artificial-intelligence/923518/musk-altman-trial-openai-demis-hassabis-google-deepmind)拥有规模优势:高管周一告诉记者,它现在每月服务超过9亿用户,覆盖230多个国家和70多种语言。与面临日益增长财务压力(https://www.theverge.com/ai-artificial-intelligence/917380/ai-monetization-anthropic-openai-token-economics-revenue)的专用AI公司相比,谷歌至少能暂时补贴成本以吸引用户。虽然它的代理尚未经历真实世界的考验,但它们正朝着有希望的方向前进。如果有一家AI公司能让代理真正有用,那就是谷歌。如果不能,它几乎没有借口可找——那么整个概念或许需要重新思考。
**关注本故事的主题和作者**,在您的个性化首页信息流中查看更多类似内容,并接收电子邮件更新。
- Hayden Field
相似文章
Gemini Spark 是谷歌对 OpenClaw 全天候 AI 代理的回应
谷歌宣布推出 Gemini Spark,这是一种主动式AI代理,可以访问个人数据并在谷歌服务和第三方应用中执行任务,将向测试者和测试版订阅用户推出。
Google 正在推出自己的 OpenClaw 版本
Google 推出 Gemini Spark,一款由 Gemini 3.5 Flash 驱动的始终在线 AI 代理,支持后台运行、通过 MCP 集成 Workspace 和第三方应用,并更新了 Antigravity。
谷歌向消费者推销AI智能体生态系统,但消费者可能不买账
谷歌在I/O大会上推出了多个AI智能体,包括信息智能体、Spark、Android Halo和Daily Brief,旨在构建AI智能体生态系统,但消费者采纳可能面临挑战。
Gemini的新AI代理与谷歌的演示一样出色
谷歌新的Gemini Spark AI代理可以自主执行多步骤任务,如起草电子邮件和分析电子表格,但引发了关于成本和隐私权衡的担忧。
@petergyang: https://x.com/petergyang/status/2057608633333199096
这篇文章回顾了谷歌在I/O大会后的AI战略,指出了产品过多带来的混乱,以及Spark作为基于Gemini的个人代理的潜力。