问答:今天的代理型人工智能是什么,我们希望它成为什么?
摘要
MIT新闻采访了菲利普·伊索拉教授,讨论代理型人工智能,涵盖其定义、与生成式AI的区别、缺乏训练数据等挑战,以及编码代理等有前景的应用。
<p><em>名为AI代理的自动化软件系统的部署近期激增。2025年11月,<a href="https://sloanreview.mit.edu/projects/the-emerging-agentic-enterprise-how-leaders-must-navigate-a-new-age-of-ai/" target="_blank">麻省理工斯隆管理学院和波士顿咨询集团</a>的报告发现,35%的受访企业已部署AI代理,另有44%计划很快实施代理型AI。</em></p><p><em>为深入理解这些日益普及工具的基本原理和潜在影响,</em>MIT新闻<em>采访了电气工程与计算机科学系(EECS)副教授、计算机科学与人工智能实验室(CSAIL)成员菲利普·伊索拉,他研究AI代理具备的智能,以及驱动代理型AI系统的底层模型与机制。</em></p><p><strong>问:</strong>什么是代理型AI?它与生成式AI模型(如ChatGPT和Claude)有何不同?</p><p><strong>答:</strong>代理型AI是在世界中采取行动的AI。这些行动可以是物理动作(如机器人操作),也可以是数字动作(如预订航班)。相比之下,生成式AI被理解为编故事、写诗、创作艺术和图像,而非替我们行动。</p><p>“代理”一词只是一个品牌名称。它通常指帮助人们与应用程序、网站或物理世界交互的AI。今天我们看到的大多数代理是数字代理,例如可以与之讨论产品投诉的客服代理。</p><p>大多数提供代理的公司,底层都使用相同的少数几个AI模型,并赋予它们采取行动和记住历史的能力。代理的核心是一个基础的生成式AI系统(如Claude)。然后,公司围绕该基础模型为其产品或应用添加不同的封装。这些封装可能是代理可以使用的特定工具,具体取决于应用。例如,代理可能可以访问计算器以解决数学问题,或者访问更复杂的硬盘和操作系统,以便记住公司的财务数据和过去的商业谈判。</p><p>开发代理型AI的最大挑战来自缺乏训练数据。如果我想创建一个能上网为我预订航班的系统,这看似简单。但我们没有大量数据精确说明如何操作——移动鼠标到何处、点击哪些按钮、出错时该做什么、或如何打电话与某人协商机票价格。训练此类系统的一种方法是让AI代理访问航空公司网站,尝试不同操作,观察哪些有效、哪些无效。这些环境很难建模,因此代理通常需要通过试错学习。</p><p><strong>问:</strong>代理型AI有哪些有前景的应用?</p><p><strong>答:</strong>我认为最成功的领域是编码代理。这源于生成式AI的发展。人们用代码训练语言模型,然后模型可以预测人类解决编码问题时会怎么做。此外,代理可以通过反馈循环学习:它尝试不同解决方案,检查答案是否正确。只要它能检查答案,AI代理就可以执行这个试错循环,直到找到好的策略。</p><p>但在自动化决策与仅为人类提供辅助和信息之间始终存在平衡。分析型AI方法(如帮助预测决策可能结果的系统)本质上并非代理型,但对人类决策者非常有信息量。对于高风险或安全关键场景(如医疗、安全、高层商业政策等),技术可能尚未准备好让AI完全自动化这些流程,或者我们甚至对此感到不适。</p><p><strong>问:</strong>使用AI代理时,我们应该考虑哪些风险?</p><p><strong>答:</strong>一个重大风险领域是,让代理为你完成某些类型的工作往往非常容易。使用编码代理时,你可以“随性编码”,只需让代理为你生成代码,自己无需辛苦工作。一个很大风险是,因为太容易,人们可能不会投入足够精力验证它是否做对了。bug会被引入,私人数据会泄露——这已经发生了。</p><p>代理并不完美,它们可能因为训练不足或不知该做什么而出错。但即使它们非常胜任,如果人类使用不当或给出过于模糊的指令,AI代理也可能因人类的错误而出错。如果人类减少参与思考所有后果,我认为我们更可能犯这类错误。</p><p>另一个方面是技能退化的风险。目前还不清楚这将会走多远,但当我们依赖代理来完成作业、编码和数学时,我们可能会失去自己做这些事的能力,而且这种能力可能丧失得过早,因为技术尚未完全准备好自动化这些流程。</p><p><strong>问:</strong>代理型AI的未来如何?</p><p><strong>答:</strong>我们现在所认为的代理型AI是指大型语言模型利用工具与数字和物理系统进行交互。一个明显的限制是,这些系统底层的架构是语言模型,且基于文本数据训练。要打造更强大的AI代理,我们可能需要建模视频、物理力、时间序列、雷达扫描等其他模态。我们可能需要拥有能够处理连续数据、高维数据、随机数据等具有根本不同架构的模型。</p><p>但另一方面,也许一个极其优秀的编码模型可以作为“操控者”,与传感器、执行器和Web API交互?一旦你拥有一个超级智能的推理系统,它能理解数学、语言和代码,你可以给它一个摄像头和一个键盘,它就能在空间领域弄清楚该做什么。下一波AI是仅仅给Claude加上传感器、执行器和工具,还是从头以全新方式构建?这是目前许多AI研究者正在思考的重大问题。</p>
查看缓存全文
缓存时间: 2026/06/30 17:19
# 问答:今天的代理式AI是什么,我们期望它成为什么?
来源:https://news.mit.edu/2026/agentic-ai-and-what-do-we-want-it-be-0630
*近期,名为AI代理的自动化软件系统部署大幅增长。2025年11月,**麻省理工学院斯隆管理学院与波士顿咨询集团*(https://sloanreview.mit.edu/projects/the-emerging-agentic-enterprise-how-leaders-must-navigate-a-new-age-of-ai/)*联合报告显示,35%的受访企业已部署AI代理,另有44%计划在近期实施代理式AI。*
*为深入理解这些日益普及的工具的基本原理及潜在影响*MIT News*采访了电气工程与计算机科学系(EECS)副教授、计算机科学与人工智能实验室(CSAIL)成员Phillip Isola。他研究AI代理所具备的智能,以及驱动代理式AI系统的底层模型与机制。*
**问:**什么是代理式AI?它与ChatGPT、Claude这类生成式AI模型有何不同?
**答:**代理式AI是在现实世界采取行动的AI。这些行动可能是物理动作,如机器人操作,也可能是数字动作,如预订机票。相比之下,我们认为生成式AI是编故事、写诗、创作艺术和图像,而不是替我们采取行动。
“代理”这个词只是一个品牌名称。它通常指帮助人们与应用程序、网站或物理世界交互的AI。今天我们遇到的大多数代理都是数字代理,比如你可以向它投诉产品问题的客服代理。
大多数提供代理的公司,底层都使用相同的少数AI模型,并赋予它们采取行动和记忆历史的能力。一个代理的核心是基础的生成式AI系统,比如Claude。然后公司在基础模型上为各自的产品或应用添加不同的“包装层”。这些包装层可能包含代理可使用的特定工具,而这些工具取决于应用场景。也许代理可以访问计算器来解决数学问题,或者访问更复杂的硬盘和操作系统来记住公司的财务数据和过去的商务谈判。
开发代理式AI的最大挑战在于缺乏训练数据。如果我想创建一个能上网帮我订机票的系统,这看起来很简单。但我们没有大量数据来明确说明具体如何操作——鼠标移到哪里、点击哪些按钮、出错时该怎么办、或者如何打电话与人协商机票价格。训练这类系统的一种方法是让AI代理访问航空网站,尝试操作,看看哪些方案有效、哪些无效。这些环境很难建模,因此代理通常需要通过试错来学习。
**问:**代理式AI有哪些有前景的应用?
**答:**我认为我们看到最成功的领域是编码代理。这是从生成式AI演变而来的。人们用代码训练语言模型,然后模型能预测人类会如何解决一个编码问题。此外,代理可以通过反馈循环来学习:它尝试不同的解决方案,然后检查答案是否正确。只要它能检查答案,AI代理就能进行这个试错循环,直到找到好的策略。
但在自动化决策与仅仅辅助和告知人类之间,总是存在一个平衡。分析型AI方法(例如帮助预测决策可能结果的系统)本质上并非代理式,但对人类决策者非常有参考价值。对于高风险或安全关键的领域,如医疗、安保、高层商业政策等,技术可能尚未准备好让AI完全自动化这些流程,或者我们甚至对这种情况感到不适。
**问:**使用AI代理时,有哪些风险需要考虑?
**答:**一个主要风险领域在于,让代理为你做某些工作往往非常容易。使用编码代理,你可以“随性编码(vibe code)”,只需让代理为你生成代码,自己就不用费心费力。一个很大的风险是,正因为太容易,人们可能没有投入足够精力去验证代理做的事是否正确。漏洞会被引入,隐私数据会泄露——这已经在发生。
代理并不完美,它们可能会因为训练不足、不知道做什么而犯错。但即使它们非常能干,如果人类使用不当或指令过于模糊,AI代理也可能因为人类的失误而出错。如果人类在思考所有后果方面的参与减少,我认为我们可能更容易犯这些错误。
另一个方面是技能退化的风险。目前还不清楚这种退化会达到什么程度,但当我们依赖代理做作业、写代码、做数学题时,我们可能会失去自己做这些事的能力,而且可能会过早失去这种能力,因为技术尚未准备好完全自动化这些流程。
**问:**代理式AI的未来会是怎样?
**答:**我们现在所说的代理式AI,指的是利用工具与数字和物理系统交互的大语言模型。一个明显的局限性是,它们底层具有语言模型的架构,并在文本数据上训练。要制造更强大的AI代理,我们可能需要建模视频、物理力、时间序列、雷达扫描等多种模态。我们可能需要具有根本不同架构的模型,能够处理连续数据、高维数据、随机数据等。
但另一方面,也许一个极其优秀的编码模型可以充当“提线木偶师”,与传感器、执行器和网络API交互?或许,一旦你拥有一个超级聪明的推理系统,能够理解数学、语言和代码,你可以给它一个摄像头和一个键盘,它就能弄清在空间领域该如何行动。下一波AI浪潮仅仅是带有传感器、执行器和工具的Claude,还是从头以全新方式构建的某种东西?这是目前AI领域许多人正在思考的重大问题。
相似文章
大多数关于“智能体 AI”的讨论都感觉太抽象了。这里是我的智能体研究系统的实际样子
作者分享了他为识别和评估公司内 AI 用例而构建的智能体研究系统的实际分解。该系统使用六个智能体进行发现、评估和上下文提取,强调人在决策环中,而非完全自主。
大问题:自主代理AI能拯救我们还是毁灭我们?
本文探讨了自主AI代理的潜在益处与风险,强调需要伦理考量和主动治理,以避免负面的社会影响。
观点:Agentic AI系统是实现AGI的可预见路径
本文认为,单一模型的单体型扩展不足以实现AGI,并提出具有多智能体协作的Agentic AI是必要的范式,理论上证明了代理系统在泛化和样本效率上具有指数级优势。
智能代理如何改变工作
OpenAI报告称,智能代理AI,特别是其Codex产品,正在改变工作方式,通过支持更长期的任务并成为跨部门(包括非技术部门)的主要AI工具,且在非开发者中迅速普及。
我们整理了42道生成式AI与智能体AI面试题(以及如何真正回答它们)。
作者宣布在其多智能体工作流沙盒中推出免费的AI面试准备模块,列出了42道针对GenAI和智能体AI岗位的面试题及其优秀答案。