@cwolferesearch: 什么是智能体?定义可以很简单:它只是一个在智能体循环中运行的LLM。为了使其…

X AI KOLs Timeline 新闻

摘要

清晰地定义了AI智能体为智能体循环中的LLM,涵盖LLM骨干、指令、工具、环境等组件,以及上下文管理和记忆等额外细节。

什么是智能体?定义可以很简单:它只是一个在智能体循环中运行的LLM。 为了使这个定义更加具体,一个智能体系统包含几个高层组件: 1. LLM骨干。 2. 指令。 3. 工具。 4. 环境。 给定初始指令/说明,这些组件在智能体循环中运行:LLM生成输出、执行工具调用、从环境获取反馈,然后重复。 每一步都会检查终止条件以判断循环是否继续。例如,我们可以定义最大步数、运行测试以确定问题是否解决,或者让LLM输出终止令牌。所有这些组件共同构成一个智能体框架,负责LLM的编排/集成细节。 (1) LLM骨干。这只是一个在智能体上下文中经过训练的标准LLM。具体来说,LLM必须能够在所提供的框架内良好工作,这需要高级的指令遵循、工具调用和推理能力。虽然任何LLM都可以用作智能体骨干,但使用推理模型通常更有优势。 (2) 指令为智能体提供解决问题所需的信息,以及帮助智能体正确解决问题的上下文。指令中应包含的信息示例包括相关领域知识(例如来自指南或政策文件)或问题解决方法(例如分解为更小的部分)。我们希望指令足够详细以可靠地引导智能体行为,但又不至于过于详细而变得脆弱/难以维护。 (3) 工具。智能体使用工具(例如API、CLI或MCP服务器)与外部环境交互。工具调用可以直接表示为LLM令牌流中的一组特殊工具调用令牌;例如,Qwen-3使用以下标签: - <tools> … </tools> 用于工具定义/说明 - <tool_call> {params} </tool_call> 用于工具调用 - <tool_response> … </tool_response> 用于工具响应/观察 (4) 环境。工具介导智能体对环境的访问。环境是有状态的,工具调用可能导致环境状态变化。环境动态编码在工具调用逻辑中——可以通过工具定义创建任意的环境规则。 额外细节。智能体框架是一个快速发展的研究领域——每天都有新的想法和组件被引入。以上未涵盖的其他框架组件包括: 1. 上下文管理控制信息如何呈现给智能体。例如,长时间运行的任务可能使用压缩来总结先前的步骤或截断来自环境的反馈(例如错误消息),以避免过量的上下文使LLM过载;见上文。 2. 记忆可以使智能体在长时间运行的任务中,甚至跨不同会话和任务,持久化有用的上下文。从概念上讲,这个记忆系统成为环境的另一个方面——它是有状态的,并且可以通过智能体的工具调用来访问。
查看原文
查看缓存全文

缓存时间: 2026/06/25 11:18

什么是智能体?定义可以很简单:就是一个在智能体循环中运行的LLM。为了让这个定义更具体,一个智能体系统包含以下几个高层级组件:1. LLM骨干。2. 指令。3. 工具。4. 环境。给定初始指令/规范后,这些组件在一个智能体循环中运行,LLM生成输出、执行工具调用、从环境接收反馈,然后重复。每一步都会检查终止条件,判断循环是否继续。例如,我们可以定义最大步数、运行测试以确定问题是否解决,或者让LLM输出一个终止标记。所有这些组件共同构成了一个智能体框架,它控制了LLM的编排/集成细节。

(1) LLM骨干。这只是一个经过训练的、能在智能体场景中运行的标准化LLM。具体来说,LLM必须能够在所提供的框架内良好工作,这需要高级的指令遵循、工具调用和推理能力。虽然任何LLM都可以用作智能体骨干,但我们通常更受益于使用推理模型。

(2) 指令 为智能体提供解决问题的必要信息,以及帮助智能体正确接近问题的上下文。指令中要包含的信息示例包括相关领域知识(例如,来自指南或政策文件)或如何解决问题(例如,分解为更小的部分)。我们希望指令足够详细,能可靠地引导智能体行为,但又不能过于详细,以免变得脆弱/难以维护。

(3) 工具。智能体使用工具(例如API、CLI或MCP服务器)与外部环境交互。工具调用可以通过创建一组特殊的工具调用标记直接表示在LLM的令牌流中;例如,Qwen-3使用以下标签:

  • <tool>...</tool> 用于工具定义/规范
  • <tool_call>{params}</tool_call> 用于工具调用。
  • <tool_response>...</tool_response> 用于工具响应/观察。

(4) 环境。工具中介了智能体对环境的访问。环境是有状态的,工具调用可能导致环境状态改变。环境动态编码在工具调用逻辑中——通过工具定义可以创建任意环境规则。

其他细节。智能体框架是一个快速发展的研究领域——每天都有新的想法和组件出现。上述未涵盖的其他框架组件包括:

  1. 上下文管理 控制信息如何呈现给智能体。例如,长时间运行的任务可能使用压缩来总结之前的步骤或截断来自环境的反馈(例如错误消息),以避免因过多上下文而使LLM过载;见上文。
  2. 记忆 允许智能体在长时间运行的任务中甚至跨不同会话和任务持久化有用的上下文。从概念上讲,这个记忆系统成为环境的另一个方面——它是有状态的,智能体可以通过工具调用来访问它。

更多详情,请查看我最近关于智能体和RL的博客文章!https://cameronrwolfe.substack.com/p/agentic-rl

相似文章