When millions of AI agents meet

YouTube AI Channels 新闻

摘要

Google DeepMind研究员探讨AI智能体与大型语言模型的核心区别、当前能力与局限，以及当数百万智能体相互交易、协作时可能催生的新经济与通往AGI的新路径。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/06/24 02:23

TL;DR: Google DeepMind 研究员 Nanad Tamashv 探讨了 AI 智能体与大型语言模型的核心区别、当前能力与局限，以及当数百万智能体相互交易、协作时可能催生的新经济与通往 AGI 的新路径。 ## 智能体 vs. 大型语言模型：概念与体验差异智能体并非全新概念，在大型语言模型出现前，AI 研究领域就已长期探索——例如在 3D 模拟环境中行动、收集物品的智能体，那时强调“具身智能”。现在，语言模型与智能体的主要区别在于：智能体观察世界状态并执行动作，而语言模型仅对提示或查询给出延续性回复。虽然当代智能体底层仍使用大型语言模型，但关键在于围绕模型构建了框架，自动执行一连串动作，赋予系统更多自主性。对用户而言，与智能体交互的界面仍类似语言模型对话，但用户角色从提问者转变为决策者和审批者。例如，策划婚礼时，LLM 只会列出餐饮服务商清单，但你需要自己发送邮件；而智能体则能直接访问你的 Gmail、起草并发送邮件（当然需要你审核）。这样你就能在等待智能体执行任务时抽身做其他事情。 ## 当前能力与局限：编码是强项，但无法做到 100% 准确目前智能体最擅长的是编码领域，因为很多正式流程可以转化为代码。编码工具（包括 Google 内部工具和外部公开工具）已显著加速软件开发，将人类精力转移到创意和设计上。但即使在编码中，智能体仍然无法保证 100% 正确。任何动作都有失败率，动作越复杂，预期失败率越高。长期存在“自动化偏见”风险：当智能体连续正确执行若干步骤后，用户可能放松警惕，不再验证，导致重大错误。因此，人类保持警觉、参与循环不仅是设计初衷，更是安全底线。 ## 长期愿景：新经济、科学突破与人类角色转变当数百万 AI 智能体不仅为人类工作，还能彼此交易、协商、委托任务时，可能催生一种“新经济”，并成为通往 AGI 的一条路径。但更重要的是对科学进步的推动：自主实验室中的智能体可以安排和运行物理实验，大幅加速发现。然而，科学场景中的闭环比软件更难——软件可以通过编写测试自动验证，而科学需要物理实验反馈，且存在硬件损坏、安全风险（如电池设计过热）。因此需要可靠的安全协议。当前一代系统擅长“组合性封闭”：基于人类数据训练，能够复制、组合已有技能，并弥合小差距。但它们尚未做出人类想不到的变革性科学发现。在 AGI 到来之前，人类仍有巨大发挥空间。 ## 为什么智能体花了这么久才实现？历史上被称为智能体的系统（如优化数据中心运营的交易算法）早已部署，但它们不含语言能力，无法与人类交互，是针对单一任务的窄智能体。现在的突破在于智能体基于语言模型，人类可以与之交谈、引导、学习。但普及的障碍来自两方面：一是模型本身仍偶发幻觉，任何幻觉可能导致灾难性后果；二是我们需要更好的协调、编排和管理智能体团队的能力——这与管理人类团队有相似之处，但智能体犯的是非人类的错误。信任需要通过长期信誉追踪来赢得。框架中应建立机制：如果智能体反复不可靠则不信任；即使可靠也不应盲目信任。承认幻觉的存在并将其整合到工作流程中，是现实的态度。 ## 面向未来的管理技能与安全框架随着智能体能力增强，我们需要培养个人管理技能来处理这些工作流程：像管理团队一样管理智能体团队，但理解它们特有的错误模式。同时，必须为科学等高风险场景建立安全防护，例如动作批准、实时验证、以及基于信誉的信任模型。最终，AI 正进入数学、科学等以前未曾涉足的领域，转变迅速，留给人类调整的窗口期比工业革命更短，因此每一步都需谨慎。 Source: https://www.youtube.com/watch?v=V04bm-3d6EQ

相似文章

@GoogleDeepMind：当数百万AI代理开始相互谈判、交易和委派任务时会发生什么？@weballergy 参与...

X AI KOLs

Google DeepMind 举办播客，讨论代理经济的兴起，其中数百万AI代理进行谈判、交易和委派，并探讨如何使代理决策多样化以避免群体思维。

@seclink: Google DeepMind 发布《From AGI to ASI》报告（arXiv 最近几天活跃讨论）：探讨 AGI 后通往超级智能的 4 条路径（scaling、paradigm shift、recursive self-impr…

X AI KOLs Following

Google DeepMind发布《From AGI to ASI》报告，探讨从AGI通往超级智能的四种路径——扩展、范式转变、递归自我改进和多智能体集体智能，并分析相关瓶颈，引发广泛讨论。

谷歌DeepMind担忧：当数百万AI代理开始交互时会发生什么？

MIT Technology Review

谷歌DeepMind与Schmidt Sciences、ARIA、Cooperative AI基金会及Google.org联手，启动了1000万美元的资助计划，旨在研究多代理AI系统的安全性，以防范AI代理广泛部署后可能引发的诈骗、提示注入和网络攻击等风险。

@LuBtc888: 给自己一个小时，拉开你和别人5年的AI认知差! DeepMind 创始人 Demis Hassabis 在剑桥的 60 分钟演讲。关于 AI 的下一阶段：从大模型、AlphaFold 到科学发现和 AGI。已加中文字幕，建议收藏慢慢看。

X AI KOLs Timeline

DeepMind创始人Demis Hassabis在剑桥大学发表60分钟演讲，涵盖AI从大模型、AlphaFold到科学发现和AGI的未来发展，视频已添加中文字幕。

Inside Google DeepMind: Reasoning, Omni, and Shipping Frontier AI

Reddit r/singularity

本文总结了Google DeepMind三位研究员关于推理、多模态生成（Omni）、编码与自我改进的深度对谈，强调视觉与动态思考将超越文本思维链，并探讨了世界模型和合成训练案例的未来趋势。

相似文章

@GoogleDeepMind：当数百万AI代理开始相互谈判、交易和委派任务时会发生什么？@weballergy 参与...

@seclink: Google DeepMind 发布《From AGI to ASI》报告（arXiv 最近几天活跃讨论）： 探讨 AGI 后通往超级智能的 4 条路径（scaling、paradigm shift、recursive self-impr…

谷歌DeepMind担忧：当数百万AI代理开始交互时会发生什么？

@LuBtc888: 给自己一个小时，拉开你和别人5年的AI认知差! DeepMind 创始人 Demis Hassabis 在剑桥的 60 分钟演讲。 关于 AI 的下一阶段：从大模型、AlphaFold 到科学发现和 AGI。 已加中文字幕，建议收藏慢慢看。

Inside Google DeepMind: Reasoning, Omni, and Shipping Frontier AI

提交意见反馈

@seclink: Google DeepMind 发布《From AGI to ASI》报告（arXiv 最近几天活跃讨论）：探讨 AGI 后通往超级智能的 4 条路径（scaling、paradigm shift、recursive self-impr…

@LuBtc888: 给自己一个小时，拉开你和别人5年的AI认知差! DeepMind 创始人 Demis Hassabis 在剑桥的 60 分钟演讲。关于 AI 的下一阶段：从大模型、AlphaFold 到科学发现和 AGI。已加中文字幕，建议收藏慢慢看。