@cwolferesearch: 什么是智能体？定义可以很简单：它只是一个在智能体循环中运行的LLM。为了使其…

X AI KOLs Timeline 2026/06/24 22:06 新闻

agent llm agentic-loop reasoning tool-calling context-management memory

摘要

清晰地定义了AI智能体为智能体循环中的LLM，涵盖LLM骨干、指令、工具、环境等组件，以及上下文管理和记忆等额外细节。

什么是智能体？定义可以很简单：它只是一个在智能体循环中运行的LLM。为了使这个定义更加具体，一个智能体系统包含几个高层组件： 1. LLM骨干。 2. 指令。 3. 工具。 4. 环境。给定初始指令/说明，这些组件在智能体循环中运行：LLM生成输出、执行工具调用、从环境获取反馈，然后重复。每一步都会检查终止条件以判断循环是否继续。例如，我们可以定义最大步数、运行测试以确定问题是否解决，或者让LLM输出终止令牌。所有这些组件共同构成一个智能体框架，负责LLM的编排/集成细节。 (1) LLM骨干。这只是一个在智能体上下文中经过训练的标准LLM。具体来说，LLM必须能够在所提供的框架内良好工作，这需要高级的指令遵循、工具调用和推理能力。虽然任何LLM都可以用作智能体骨干，但使用推理模型通常更有优势。 (2) 指令为智能体提供解决问题所需的信息，以及帮助智能体正确解决问题的上下文。指令中应包含的信息示例包括相关领域知识（例如来自指南或政策文件）或问题解决方法（例如分解为更小的部分）。我们希望指令足够详细以可靠地引导智能体行为，但又不至于过于详细而变得脆弱/难以维护。 (3) 工具。智能体使用工具（例如API、CLI或MCP服务器）与外部环境交互。工具调用可以直接表示为LLM令牌流中的一组特殊工具调用令牌；例如，Qwen-3使用以下标签： - <tools> … </tools> 用于工具定义/说明 - <tool_call> {params} </tool_call> 用于工具调用 - <tool_response> … </tool_response> 用于工具响应/观察 (4) 环境。工具介导智能体对环境的访问。环境是有状态的，工具调用可能导致环境状态变化。环境动态编码在工具调用逻辑中——可以通过工具定义创建任意的环境规则。额外细节。智能体框架是一个快速发展的研究领域——每天都有新的想法和组件被引入。以上未涵盖的其他框架组件包括： 1. 上下文管理控制信息如何呈现给智能体。例如，长时间运行的任务可能使用压缩来总结先前的步骤或截断来自环境的反馈（例如错误消息），以避免过量的上下文使LLM过载；见上文。 2. 记忆可以使智能体在长时间运行的任务中，甚至跨不同会话和任务，持久化有用的上下文。从概念上讲，这个记忆系统成为环境的另一个方面——它是有状态的，并且可以通过智能体的工具调用来访问。

查看原文

查看缓存全文

缓存时间: 2026/06/25 11:18

什么是智能体？定义可以很简单：就是一个在智能体循环中运行的LLM。为了让这个定义更具体，一个智能体系统包含以下几个高层级组件：1. LLM骨干。2. 指令。3. 工具。4. 环境。给定初始指令/规范后，这些组件在一个智能体循环中运行，LLM生成输出、执行工具调用、从环境接收反馈，然后重复。每一步都会检查终止条件，判断循环是否继续。例如，我们可以定义最大步数、运行测试以确定问题是否解决，或者让LLM输出一个终止标记。所有这些组件共同构成了一个智能体框架，它控制了LLM的编排/集成细节。

(1) LLM骨干。这只是一个经过训练的、能在智能体场景中运行的标准化LLM。具体来说，LLM必须能够在所提供的框架内良好工作，这需要高级的指令遵循、工具调用和推理能力。虽然任何LLM都可以用作智能体骨干，但我们通常更受益于使用推理模型。

(2) 指令为智能体提供解决问题的必要信息，以及帮助智能体正确接近问题的上下文。指令中要包含的信息示例包括相关领域知识（例如，来自指南或政策文件）或如何解决问题（例如，分解为更小的部分）。我们希望指令足够详细，能可靠地引导智能体行为，但又不能过于详细，以免变得脆弱/难以维护。

(3) 工具。智能体使用工具（例如API、CLI或MCP服务器）与外部环境交互。工具调用可以通过创建一组特殊的工具调用标记直接表示在LLM的令牌流中；例如，Qwen-3使用以下标签：

<tool>...</tool> 用于工具定义/规范
<tool_call>{params}</tool_call> 用于工具调用。
<tool_response>...</tool_response> 用于工具响应/观察。

(4) 环境。工具中介了智能体对环境的访问。环境是有状态的，工具调用可能导致环境状态改变。环境动态编码在工具调用逻辑中——通过工具定义可以创建任意环境规则。

其他细节。智能体框架是一个快速发展的研究领域——每天都有新的想法和组件出现。上述未涵盖的其他框架组件包括：

上下文管理 控制信息如何呈现给智能体。例如，长时间运行的任务可能使用压缩来总结之前的步骤或截断来自环境的反馈（例如错误消息），以避免因过多上下文而使LLM过载；见上文。
记忆允许智能体在长时间运行的任务中甚至跨不同会话和任务持久化有用的上下文。从概念上讲，这个记忆系统成为环境的另一个方面——它是有状态的，智能体可以通过工具调用来访问它。

更多详情，请查看我最近关于智能体和RL的博客文章！https://cameronrwolfe.substack.com/p/agentic-rl

相似文章

@Yeuoly1: 其实还蛮好奇大家对 “一个 Agent” 、 “Agent 同事” 的定义到底是什么，听着是挺性感，但 LLM 底子都是 stateless 的所谓的 “Agent 同事” 这个实体到底是什么，是一个 Agent-Loop 带着一堆 m…

X AI KOLs Following

讨论了AI Agent和'Agent同事'的定义，指出LLM本质上是无状态的，并质疑Agent实体的具体形式。

@cwolferesearch: 什么是智能体？定义可以很简单：它只是一个在智能体循环中运行的LLM。为了使其…

相似文章

@Yeuoly1: 其实还蛮好奇大家对 “一个 Agent” 、 “Agent 同事” 的定义到底是什么，听着是挺性感，但 LLM 底子都是 stateless 的所谓的 “Agent 同事” 这个实体到底是什么，是一个 Agent-Loop 带着一堆 m…

@HarperSCarroll: 到底是什么将聊天机器人变成了AI智能体？AI模型（大型语言模型，即LLM）周围的“框架”。我…

超越LLM：为何可扩展的企业AI落地依赖于Agent逻辑

有人能帮我理解AI Agent的用例或让我信服吗？

大多数关于“智能体 AI”的讨论都感觉太抽象了。这里是我的智能体研究系统的实际样子

提交意见反馈

相似文章

@Yeuoly1: 其实还蛮好奇大家对 “一个 Agent” 、 “Agent 同事” 的定义到底是什么，听着是挺性感，但 LLM 底子都是 stateless 的 所谓的 “Agent 同事” 这个实体到底是什么，是一个 Agent-Loop 带着一堆 m…

@HarperSCarroll: 到底是什么将聊天机器人变成了AI智能体？AI模型（大型语言模型，即LLM）周围的“框架”。我…

超越LLM：为何可扩展的企业AI落地依赖于Agent逻辑

有人能帮我理解AI Agent的用例或让我信服吗？

大多数关于“智能体 AI”的讨论都感觉太抽象了。这里是我的智能体研究系统的实际样子

提交意见反馈

@Yeuoly1: 其实还蛮好奇大家对 “一个 Agent” 、 “Agent 同事” 的定义到底是什么，听着是挺性感，但 LLM 底子都是 stateless 的所谓的 “Agent 同事” 这个实体到底是什么，是一个 Agent-Loop 带着一堆 m…