@cwolferesearch: 什么是智能体?定义可以很简单:它只是一个在智能体循环中运行的LLM。为了使其…
摘要
清晰地定义了AI智能体为智能体循环中的LLM,涵盖LLM骨干、指令、工具、环境等组件,以及上下文管理和记忆等额外细节。
查看缓存全文
缓存时间: 2026/06/25 11:18
什么是智能体?定义可以很简单:就是一个在智能体循环中运行的LLM。为了让这个定义更具体,一个智能体系统包含以下几个高层级组件:1. LLM骨干。2. 指令。3. 工具。4. 环境。给定初始指令/规范后,这些组件在一个智能体循环中运行,LLM生成输出、执行工具调用、从环境接收反馈,然后重复。每一步都会检查终止条件,判断循环是否继续。例如,我们可以定义最大步数、运行测试以确定问题是否解决,或者让LLM输出一个终止标记。所有这些组件共同构成了一个智能体框架,它控制了LLM的编排/集成细节。
(1) LLM骨干。这只是一个经过训练的、能在智能体场景中运行的标准化LLM。具体来说,LLM必须能够在所提供的框架内良好工作,这需要高级的指令遵循、工具调用和推理能力。虽然任何LLM都可以用作智能体骨干,但我们通常更受益于使用推理模型。
(2) 指令 为智能体提供解决问题的必要信息,以及帮助智能体正确接近问题的上下文。指令中要包含的信息示例包括相关领域知识(例如,来自指南或政策文件)或如何解决问题(例如,分解为更小的部分)。我们希望指令足够详细,能可靠地引导智能体行为,但又不能过于详细,以免变得脆弱/难以维护。
(3) 工具。智能体使用工具(例如API、CLI或MCP服务器)与外部环境交互。工具调用可以通过创建一组特殊的工具调用标记直接表示在LLM的令牌流中;例如,Qwen-3使用以下标签:
<tool>...</tool>用于工具定义/规范<tool_call>{params}</tool_call>用于工具调用。<tool_response>...</tool_response>用于工具响应/观察。
(4) 环境。工具中介了智能体对环境的访问。环境是有状态的,工具调用可能导致环境状态改变。环境动态编码在工具调用逻辑中——通过工具定义可以创建任意环境规则。
其他细节。智能体框架是一个快速发展的研究领域——每天都有新的想法和组件出现。上述未涵盖的其他框架组件包括:
- 上下文管理 控制信息如何呈现给智能体。例如,长时间运行的任务可能使用压缩来总结之前的步骤或截断来自环境的反馈(例如错误消息),以避免因过多上下文而使LLM过载;见上文。
- 记忆 允许智能体在长时间运行的任务中甚至跨不同会话和任务持久化有用的上下文。从概念上讲,这个记忆系统成为环境的另一个方面——它是有状态的,智能体可以通过工具调用来访问它。
更多详情,请查看我最近关于智能体和RL的博客文章!https://cameronrwolfe.substack.com/p/agentic-rl
相似文章
@Yeuoly1: 其实还蛮好奇大家对 “一个 Agent” 、 “Agent 同事” 的定义到底是什么,听着是挺性感,但 LLM 底子都是 stateless 的 所谓的 “Agent 同事” 这个实体到底是什么,是一个 Agent-Loop 带着一堆 m…
讨论了AI Agent和'Agent同事'的定义,指出LLM本质上是无状态的,并质疑Agent实体的具体形式。
@HarperSCarroll: 到底是什么将聊天机器人变成了AI智能体?AI模型(大型语言模型,即LLM)周围的“框架”。我…
本视频解释了AI智能体框架的概念:LLM核心、记忆、工具,以及实现迭代决策以达到目标的循环。
超越LLM:为何可扩展的企业AI落地依赖于Agent逻辑
IBM Research探索了Agent逻辑——诸如知识图谱和程序分析等软件原语——如何引导基于LLM的Agent高效处理复杂的企业工作流,减少幻觉和成本,同时改善结果。
有人能帮我理解AI Agent的用例或让我信服吗?
一位软件开发者质疑AI Agent的实际价值,表达了对控制权、问责制的担忧,并怀疑手动自动化结合LLM是否比委托给自主代理更可靠。
大多数关于“智能体 AI”的讨论都感觉太抽象了。这里是我的智能体研究系统的实际样子
作者分享了他为识别和评估公司内 AI 用例而构建的智能体研究系统的实际分解。该系统使用六个智能体进行发现、评估和上下文提取,强调人在决策环中,而非完全自主。