When millions of AI agents meet
摘要
Google DeepMind研究员探讨AI智能体与大型语言模型的核心区别、当前能力与局限,以及当数百万智能体相互交易、协作时可能催生的新经济与通往AGI的新路径。
暂无内容
查看缓存全文
缓存时间: 2026/06/24 02:23
TL;DR: Google DeepMind 研究员 Nanad Tamashv 探讨了 AI 智能体与大型语言模型的核心区别、当前能力与局限,以及当数百万智能体相互交易、协作时可能催生的新经济与通往 AGI 的新路径。
## 智能体 vs. 大型语言模型:概念与体验差异
智能体并非全新概念,在大型语言模型出现前,AI 研究领域就已长期探索——例如在 3D 模拟环境中行动、收集物品的智能体,那时强调“具身智能”。现在,语言模型与智能体的主要区别在于:智能体观察世界状态并执行动作,而语言模型仅对提示或查询给出延续性回复。虽然当代智能体底层仍使用大型语言模型,但关键在于围绕模型构建了框架,自动执行一连串动作,赋予系统更多自主性。
对用户而言,与智能体交互的界面仍类似语言模型对话,但用户角色从提问者转变为决策者和审批者。例如,策划婚礼时,LLM 只会列出餐饮服务商清单,但你需要自己发送邮件;而智能体则能直接访问你的 Gmail、起草并发送邮件(当然需要你审核)。这样你就能在等待智能体执行任务时抽身做其他事情。
## 当前能力与局限:编码是强项,但无法做到 100% 准确
目前智能体最擅长的是编码领域,因为很多正式流程可以转化为代码。编码工具(包括 Google 内部工具和外部公开工具)已显著加速软件开发,将人类精力转移到创意和设计上。但即使在编码中,智能体仍然无法保证 100% 正确。任何动作都有失败率,动作越复杂,预期失败率越高。长期存在“自动化偏见”风险:当智能体连续正确执行若干步骤后,用户可能放松警惕,不再验证,导致重大错误。因此,人类保持警觉、参与循环不仅是设计初衷,更是安全底线。
## 长期愿景:新经济、科学突破与人类角色转变
当数百万 AI 智能体不仅为人类工作,还能彼此交易、协商、委托任务时,可能催生一种“新经济”,并成为通往 AGI 的一条路径。但更重要的是对科学进步的推动:自主实验室中的智能体可以安排和运行物理实验,大幅加速发现。然而,科学场景中的闭环比软件更难——软件可以通过编写测试自动验证,而科学需要物理实验反馈,且存在硬件损坏、安全风险(如电池设计过热)。因此需要可靠的安全协议。
当前一代系统擅长“组合性封闭”:基于人类数据训练,能够复制、组合已有技能,并弥合小差距。但它们尚未做出人类想不到的变革性科学发现。在 AGI 到来之前,人类仍有巨大发挥空间。
## 为什么智能体花了这么久才实现?
历史上被称为智能体的系统(如优化数据中心运营的交易算法)早已部署,但它们不含语言能力,无法与人类交互,是针对单一任务的窄智能体。现在的突破在于智能体基于语言模型,人类可以与之交谈、引导、学习。但普及的障碍来自两方面:一是模型本身仍偶发幻觉,任何幻觉可能导致灾难性后果;二是我们需要更好的协调、编排和管理智能体团队的能力——这与管理人类团队有相似之处,但智能体犯的是非人类的错误。
信任需要通过长期信誉追踪来赢得。框架中应建立机制:如果智能体反复不可靠则不信任;即使可靠也不应盲目信任。承认幻觉的存在并将其整合到工作流程中,是现实的态度。
## 面向未来的管理技能与安全框架
随着智能体能力增强,我们需要培养个人管理技能来处理这些工作流程:像管理团队一样管理智能体团队,但理解它们特有的错误模式。同时,必须为科学等高风险场景建立安全防护,例如动作批准、实时验证、以及基于信誉的信任模型。最终,AI 正进入数学、科学等以前未曾涉足的领域,转变迅速,留给人类调整的窗口期比工业革命更短,因此每一步都需谨慎。
Source: https://www.youtube.com/watch?v=V04bm-3d6EQ
相似文章
@GoogleDeepMind:当数百万AI代理开始相互谈判、交易和委派任务时会发生什么?@weballergy 参与...
Google DeepMind 举办播客,讨论代理经济的兴起,其中数百万AI代理进行谈判、交易和委派,并探讨如何使代理决策多样化以避免群体思维。
@seclink: Google DeepMind 发布《From AGI to ASI》报告(arXiv 最近几天活跃讨论): 探讨 AGI 后通往超级智能的 4 条路径(scaling、paradigm shift、recursive self-impr…
Google DeepMind发布《From AGI to ASI》报告,探讨从AGI通往超级智能的四种路径——扩展、范式转变、递归自我改进和多智能体集体智能,并分析相关瓶颈,引发广泛讨论。
谷歌DeepMind担忧:当数百万AI代理开始交互时会发生什么?
谷歌DeepMind与Schmidt Sciences、ARIA、Cooperative AI基金会及Google.org联手,启动了1000万美元的资助计划,旨在研究多代理AI系统的安全性,以防范AI代理广泛部署后可能引发的诈骗、提示注入和网络攻击等风险。
@LuBtc888: 给自己一个小时,拉开你和别人5年的AI认知差! DeepMind 创始人 Demis Hassabis 在剑桥的 60 分钟演讲。 关于 AI 的下一阶段:从大模型、AlphaFold 到科学发现和 AGI。 已加中文字幕,建议收藏慢慢看。
DeepMind创始人Demis Hassabis在剑桥大学发表60分钟演讲,涵盖AI从大模型、AlphaFold到科学发现和AGI的未来发展,视频已添加中文字幕。
Inside Google DeepMind: Reasoning, Omni, and Shipping Frontier AI
本文总结了Google DeepMind三位研究员关于推理、多模态生成(Omni)、编码与自我改进的深度对谈,强调视觉与动态思考将超越文本思维链,并探讨了世界模型和合成训练案例的未来趋势。