弥合智能体-世界鸿沟：面向基于LLM的智能体的文本世界模型

Hugging Face Daily Papers 2026/06/08 00:00 论文

摘要

本文系统综述了面向基于LLM的智能体的文本世界模型，涵盖基础、构建范式、在规划与训练中的应用以及评估方法。

基于大语言模型（LLM）的智能体越来越多地被用于交互式文本环境，从网页导航、代码编辑到工具使用和长程对话。然而，其中许多智能体在很大程度上仍然是反应式的，将观察映射到行动，而没有明确建模这些环境的结构和演化方式。这催生了文本世界模型（TWM）：一种基于文本状态的转移模型，给定一个状态和候选行动，预测产生的网页、终端输出、API响应或用户回复，从而支持规划、高效学习和原则性评估。我们系统性地综述了面向基于LLM的智能体的文本世界模型，围绕一个形式化框架和智能体生命周期展开：（1）基础，定义文本世界模型并通过状态表示和基础领域对其进行刻画；（2）构建，将LLM作为世界模型和代码作为世界模型两种范式进行分类，并综述构建它们的方法；（3）应用，考察世界模型如何在训练时通过经验合成、在推理时通过规划、验证和适应来支持智能体；（4）评估，涵盖对世界模型本身的评估以及将其用作智能体的评估环境。我们旨在整合这一快速发展的领域，明确其设计空间，并突出未来研究中的开放性挑战。

查看原文

查看缓存全文

缓存时间: 2026/06/10 05:45

论文页面 - 弥合智能体-世界差距：面向LLM智能体的文本世界模型

来源：https://huggingface.co/papers/2606.09032 作者：

摘要

文本世界模型作为基于大语言模型（LLM）智能体在交互式环境中的过渡模型，通过从文本状态和动作预测环境变化，支持规划和高效学习。

基于大语言模型（LLM）的智能体越来越多地应用于交互式文本环境，涵盖网页导航、代码编辑、工具使用以及长程对话等场景。然而，许多智能体仍然高度反应式，直接将观测映射到动作，缺乏对环境结构及演化方式的显式建模。这催生了文本世界模型（TWMs）：即基于文本状态的过渡模型，给定一个状态和候选动作，能够预测相应的网页内容、终端输出、API响应或用户回复，从而支持规划、高效学习以及有原则的评估。我们围绕一个正式框架和智能体生命周期对面向LLM智能体的文本世界模型进行了系统性综述，组织如下：（1）基础：定义文本世界模型，并根据状态表示和基础领域对其进行表征；（2）构建：对LLM作为世界模型（LLM-as-WM）和代码作为世界模型（Code-as-WM）两种范式进行分类，并回顾构建方法；（3）应用：审视世界模型如何在训练阶段通过经验合成、在推理阶段通过规划、验证和自适应来支持智能体；（4）评估：涵盖对世界模型本身的评估，以及将其作为智能体评估环境的用途。我们旨在整合这一快速发展领域的研究，厘清其设计空间，并强调未来的开放挑战。

查看 arXiv 页面（https://arxiv.org/abs/2606.09032）| 查看 PDF（https://arxiv.org/pdf/2606.09032）| GitHub5（https://github.com/sustech-nlp/awesome-text-world-models）| 添加到收藏（https://huggingface.co/login?next=%2Fpapers%2F2606.09032）

在您的智能体中获取本文：

hf papers read 2606\.09032

没有最新命令行工具？curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用本文的模型（0）

暂无模型引用本文

请在一个模型的 README.md 中引用 arxiv.org/abs/2606.09032，以便从本页面链接该模型。

引用本文的数据集（0）

暂无数据集引用本文

请在一个数据集的 README.md 中引用 arxiv.org/abs/2606.09032，以便从本页面链接该数据集。

引用本文的空间（0）

暂无空间引用本文

请在一个空间的 README.md 中引用 arxiv.org/abs/2606.09032，以便从本页面链接该空间。

弥合智能体-世界鸿沟：面向基于LLM的智能体的文本世界模型

论文页面 - 弥合智能体-世界差距：面向LLM智能体的文本世界模型

摘要

引用本文的模型（0）

引用本文的数据集（0）

引用本文的空间（0）

包含本文的收藏（1）

相似文章

为何通用人工智能需要世界模型：大型语言模型的不足与世界模型的潜在优势

Qwen-AgentWorld: 通用智能体的语言世界模型

你认为World Models会通向AGI吗？

虚构世界构建：基于分层上下文压缩与迭代审核的多智能体LLM协作

模拟一切，差不多如此：世界模型的承诺与局限

提交意见反馈