弥合智能体-世界鸿沟:面向基于LLM的智能体的文本世界模型
摘要
本文系统综述了面向基于LLM的智能体的文本世界模型,涵盖基础、构建范式、在规划与训练中的应用以及评估方法。
查看缓存全文
缓存时间: 2026/06/10 05:45
论文页面 - 弥合智能体-世界差距:面向LLM智能体的文本世界模型
来源:https://huggingface.co/papers/2606.09032 作者:
,
,
,
,
,
,
,
,
,
,
,
,
,
,
摘要
文本世界模型作为基于大语言模型(LLM)智能体在交互式环境中的过渡模型,通过从文本状态和动作预测环境变化,支持规划和高效学习。
基于大语言模型(LLM)的智能体越来越多地应用于交互式文本环境,涵盖网页导航、代码编辑、工具使用以及长程对话等场景。然而,许多智能体仍然高度反应式,直接将观测映射到动作,缺乏对环境结构及演化方式的显式建模。这催生了文本世界模型(TWMs):即基于文本状态的过渡模型,给定一个状态和候选动作,能够预测相应的网页内容、终端输出、API响应或用户回复,从而支持规划、高效学习以及有原则的评估。我们围绕一个正式框架和智能体生命周期对面向LLM智能体的文本世界模型进行了系统性综述,组织如下:(1)基础:定义文本世界模型,并根据状态表示和基础领域对其进行表征;(2)构建:对LLM作为世界模型(LLM-as-WM)和代码作为世界模型(Code-as-WM)两种范式进行分类,并回顾构建方法;(3)应用:审视世界模型如何在训练阶段通过经验合成、在推理阶段通过规划、验证和自适应来支持智能体;(4)评估:涵盖对世界模型本身的评估,以及将其作为智能体评估环境的用途。我们旨在整合这一快速发展领域的研究,厘清其设计空间,并强调未来的开放挑战。
查看 arXiv 页面(https://arxiv.org/abs/2606.09032)| 查看 PDF(https://arxiv.org/pdf/2606.09032)| GitHub5(https://github.com/sustech-nlp/awesome-text-world-models)| 添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2606.09032)
在您的智能体中获取本文:
hf papers read 2606\.09032
没有最新命令行工具?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用本文的模型(0)
暂无模型引用本文
请在一个模型的 README.md 中引用 arxiv.org/abs/2606.09032,以便从本页面链接该模型。
引用本文的数据集(0)
暂无数据集引用本文
请在一个数据集的 README.md 中引用 arxiv.org/abs/2606.09032,以便从本页面链接该数据集。
引用本文的空间(0)
暂无空间引用本文
请在一个空间的 README.md 中引用 arxiv.org/abs/2606.09032,以便从本页面链接该空间。
包含本文的收藏(1)
相似文章
为何通用人工智能需要世界模型:大型语言模型的不足与世界模型的潜在优势
本文认为,大型语言模型在因果推理和长时域规划方面存在困难,其原因在于序列预测与对潜在环境动态的推理之间存在目标层面的不匹配,并引入了潜在动态推断视角以及Flux环境来研究这些局限性。
World-Language-Action模型:统一世界建模、语言推理与动作合成
本文介绍了World-Language-Action(WLA)模型,这是一种具身基础模型,能够从文本、图像和机器人状态中联合预测文本子任务、子目标图像和机器人动作,在模拟和真实环境中实现了最先进的多任务与长周期学习能力。
用于LLM智能体离线策略评估的自回归扩散世界模型
提出了Adwm,一种用于LLM智能体离线策略评估的自回归扩散世界模型,能够从预先收集的轨迹中实现可靠的价值估计,无需在线交互。
面向大型语言模型的智能体环境工程:环境建模、合成、评估与应用综述
一篇关于面向大型语言模型的智能体环境工程的全面综述,涵盖环境建模、合成、评估与应用,重点聚焦于智能体与环境的协同演化。
机器人学习中的世界模型:全面综述
本综述全面回顾了机器人学习中世界模型的文献,涵盖其在策略学习、规划和模拟中的作用。文章突出了预测建模在具身智能体中的关键范式、基准测试及未来发展方向。