Gemini的新AI代理与谷歌的演示一样出色

The Verge 产品

摘要

谷歌新的Gemini Spark AI代理可以自主执行多步骤任务,如起草电子邮件和分析电子表格,但引发了关于成本和隐私权衡的担忧。

<figure> <img alt="" data-caption="" data-portal-copyright="" data-has-syndication-rights="1" src="https://platform.theverge.com/wp-content/uploads/sites/2/2026/06/lcimg-0ebbe911-9fbb-4f68-97b0-b7361d7cb53c.jpeg?quality=90&#038;strip=all&#038;crop=0,0,100,100" /> <figcaption> </figcaption> </figure> <p class="has-text-align-none">谷歌新的"24/7"AI代理Gemini Spark在替你做事方面出奇地好。但我不确定它是否值得付出财务成本和潜在的隐私权衡。</p> <p class="has-text-align-none">上周,该公司让我体验了Spark。谷歌将Spark宣传为一种AI代理,可以接手任务并在后台处理——甚至是多步骤的任务——让你可以放下手机或离开电脑。它还在<a href="https://gemini.google/overview/agent/spark/"><em>Spark网站的顶部</em></a>宣传说,它"始终听从你的指令",你"选择打开它",而且"它被设计成在采取重大行动前与你核实"。鉴于那……</p> <p><a href="https://www.theverge.com/tech/941138/google-gemini-spark-ai-agent-hands-on">在The Verge阅读完整故事</a></p>
查看原文
查看缓存全文

缓存时间: 2026/06/01 22:06

# Gemini 新推出的 AI 代理表现与谷歌演示几乎一致 来源:https://www.theverge.com/tech/941138/google-gemini-spark-ai-agent-hands-on 谷歌全新推出的“7×24 小时”AI 代理 Gemini Spark 在替你执行任务时表现惊人地出色。但我不确定它是否值得付出金钱成本以及潜在的隐私权衡。 上周,谷歌让我提前体验了 Spark。谷歌将其定位为一种能够在后台接管并处理任务的 AI 代理——就连多步骤任务也不在话下——这样你就可以放下手机或离开电脑。Spark 官网(https://gemini.google/overview/agent/spark/)在显眼位置注明,它“始终听从你的指令”,“由你选择开启”,并且“在执行重大操作前会征求你的同意”。考虑到人们对 AI 日益增长的怀疑态度,这很像那种“‘我与流氓 AI 无关’的 T 恤,但人们已在问我这件 T 恤上写着的答案”。 我不知道从何入手,于是借鉴了我同事 Antonio 的做法(https://www.theverge.com/report/822443/microsoft-windows-copilot-vision-ai-assistant-pc-voice-controls-impressions):我决定用 Spark 来处理谷歌在 I/O 大会上演示的那些任务。它在我的家庭办公室里能像在大会舞台上一样发挥出色吗? 谷歌的 Josh Woodward 正在演示 Gemini Spark。(https://platform.theverge.com/wp-content/uploads/sites/2/2026/06/lcimg-f4e04b1d-fa8e-4d4c-86f7-ac5a5c4fd0ad.jpeg?quality=90&strip=all&crop=0,0,100,100) 在 I/O 大会上,谷歌副总裁 Josh Woodward 展示了几种不同的用例。第一个是让 Spark 起草一封给谷歌某个团队的邮件,汇总关于 Gemini Live 发布的所有信息以及“上周的成果”,并利用一项特殊的 AI 技能让邮件读起来像他的风格。让谷歌替谷歌办事*按理说*应该是世界上最容易的事,所以我决定增加难度。 我让 Gemini 起草一封给我妻子的邮件,汇总我们 2026 年每月的平均食品杂货支出。我推断这项测试能反映几个问题:Spark 能否识别出我妻子是谁(前提是我没有提供她的名字)?能否在 Drive 中找到我们的预算电子表格(文件名并不包含“预算”二字)?以及能否真正在 Gmail 中起草一封邮件? 不久后看到 Spark 的结果时,我由衷地感叹:“哇,这实在太离谱了。”Spark 找到了我妻子的邮箱地址,从我们 2026 年的预算表格中提取了正确的信息,拿走了每月的食品杂货总额——包括五月份尚未完整的数据(当时五月还没结束),然后计算出平均值,并全部放入了我 Gmail 中的一封草稿邮件里。邮件的正文直接称呼了我妻子的名字,尽管她的邮箱地址并不包含名字。邮件甚至还用了只有我们俩之间才会使用的署名方式。 在下一个例子中,Woodward 请求帮忙筹划一场街区派对。我*并没有*在筹划街区派对,但我用他提出的相同问题向 Spark 求助。结果并不顺利。它创建了一个“高度真实的人员及携带物品参考表”,在我 Gmail 中起草了一封邮件,提到了一个并不存在的共享登记表,还生成了一份难看的幻灯片,里面详细介绍了城市许可证信息。 为了进一步测试 Spark,我让它创建那个缺失的登记表,并把链接添加到已起草的邮件里。虽然 Spark 花了几分钟才弄明白,但最终任务还是成功了;它创建了一个电子表格,然后回到草稿邮件正文,将链接插入其中。 Woodward 的最后一个演示可以说最具震撼力。他用语音对 Spark 下达了一系列指令:将日历上与 CEO Sundar Pichai 的会议设为粉红色;给新邻居写一张便条邀请他参加街区派对;创建一个文档,帮助安排孩子们学年末待办事项。我依样画葫芦,让它每月在我妻子生日前创建一个日历事件,并设为粉红色;起草一封给我家人的邮件,告知他们我要发送最新一季《Taskmaster》第一集的链接;以及创建一个文档,列出我和妻子在准备送孩子上幼儿园前需要了解的最重要事项。 我在太平洋时间周五下午 3:35 提交了这个请求。在 I/O 大会上,Woodward 曾故意放下手机,承诺稍后在主题演讲中查看结果,他也确实这么做了。但在我处理了一个小插曲——Spark 想访问我的通讯录,被我拒绝——之后,大约四分钟后我的任务就完成了。 再次,结果让我有点震惊,尽管并不完美: - 我的谷歌日历现在每个月都在我妻子生日前的那天,从上午 9 点到 10 点添加了事件。提醒颜色是谷歌所谓的“火烈鸟粉”,虽然不完全是“粉红色”,但也差不多了。 - Spark 抓取了我直系亲属的邮箱地址,并放入了草稿邮件中。(奇怪的是,它没有包含我妻子的邮箱。)邮件正文正确写出了最新一季《Taskmaster》第一集的名称,但链接却是预告片,而不是实际剧集。邮件还用了“haha”这个词,这是我平时在非正式聊天中会写的。 - Spark 在我的 Drive 里创建了一份关于幼儿园准备清单的 Google 文档。不过,这份文档仅对我可见;我询问 Spark 能否授权给我的妻子,它回复说目前无法做到这一点。 Spark 可以成为一个强大的工具。但有几个注意事项需要提一下。和所有 AI 工具一样,你仍需检查它的输出以确保准确——当它从个人信息中提取内容,为你与熟人分享的材料做准备时,准确性的风险更高。尽管谷歌宣称 Spark 可以自主运行,但我发现自己总是盯着它,或者检查它发到我手机上的通知。一个助手如果连小事都要我盯着,而不是信任它,那又有什么用?而且,为什么我要为这些相对琐碎的任务,去消耗资源密集型数据中心的大量电力,却还如此不确定? 目前,Spark 仅对谷歌 AI Ultra 计划(月费 99.99 美元起)的订阅用户开放,并且仅限于美国用户和英语环境。谷歌提供了免费测试 Spark 的机会,但我不认为它好到足以成为你花大价钱订阅那些昂贵计划的主要原因。尤其是,我完全能亲手完成所有让 Spark 做的任务——只不过要花更多时间。 另外,如果你已经深度融入谷歌生态系统并开启了 Personal Intelligence,Spark 的表现会更好。我的谷歌账户已有约 20 年历史,因此 Spark 有大量数据可供参考。不过,虽然谷歌承诺(https://blog.google/products-and-platforms/products/search/personal-intelligence-ai-mode-search/)在开启 Personal Intelligence 后,Gemini“不会直接利用”你的 Gmail 收件箱进行训练,但你仍然要相信谷歌会妥善管理你的数据(https://www.theverge.com/tech/934172/google-io-gemini-ai-trust-personal-data)。目前,我不确定这是否值得付出成本或承担风险。 **关注本文的主题和作者**,即可在个性化首页信息流中查看更多类似内容,并接收电子邮件更新。

相似文章