弥合智能体-世界鸿沟:面向基于LLM的智能体的文本世界模型

Hugging Face Daily Papers 论文

摘要

本文系统综述了面向基于LLM的智能体的文本世界模型,涵盖基础、构建范式、在规划与训练中的应用以及评估方法。

基于大语言模型(LLM)的智能体越来越多地被用于交互式文本环境,从网页导航、代码编辑到工具使用和长程对话。然而,其中许多智能体在很大程度上仍然是反应式的,将观察映射到行动,而没有明确建模这些环境的结构和演化方式。这催生了文本世界模型(TWM):一种基于文本状态的转移模型,给定一个状态和候选行动,预测产生的网页、终端输出、API响应或用户回复,从而支持规划、高效学习和原则性评估。我们系统性地综述了面向基于LLM的智能体的文本世界模型,围绕一个形式化框架和智能体生命周期展开:(1)基础,定义文本世界模型并通过状态表示和基础领域对其进行刻画;(2)构建,将LLM作为世界模型和代码作为世界模型两种范式进行分类,并综述构建它们的方法;(3)应用,考察世界模型如何在训练时通过经验合成、在推理时通过规划、验证和适应来支持智能体;(4)评估,涵盖对世界模型本身的评估以及将其用作智能体的评估环境。我们旨在整合这一快速发展的领域,明确其设计空间,并突出未来研究中的开放性挑战。
查看原文
查看缓存全文

缓存时间: 2026/06/10 05:45

论文页面 - 弥合智能体-世界差距:面向LLM智能体的文本世界模型

来源:https://huggingface.co/papers/2606.09032 作者:

,

,

,

,

,

,

,

,

,

,

,

,

,

,

摘要

文本世界模型作为基于大语言模型(LLM)智能体在交互式环境中的过渡模型,通过从文本状态和动作预测环境变化,支持规划和高效学习。

基于大语言模型(LLM)的智能体越来越多地应用于交互式文本环境,涵盖网页导航、代码编辑、工具使用以及长程对话等场景。然而,许多智能体仍然高度反应式,直接将观测映射到动作,缺乏对环境结构及演化方式的显式建模。这催生了文本世界模型(TWMs):即基于文本状态过渡模型,给定一个状态和候选动作,能够预测相应的网页内容、终端输出、API响应或用户回复,从而支持规划、高效学习以及有原则的评估。我们围绕一个正式框架和智能体生命周期对面向LLM智能体文本世界模型进行了系统性综述,组织如下:(1)基础:定义文本世界模型,并根据状态表示和基础领域对其进行表征;(2)构建:对LLM作为世界模型(LLM-as-WM)和代码作为世界模型(Code-as-WM)两种范式进行分类,并回顾构建方法;(3)应用:审视世界模型如何在训练阶段通过经验合成、在推理阶段通过规划验证自适应来支持智能体;(4)评估:涵盖对世界模型本身的评估,以及将其作为智能体评估环境的用途。我们旨在整合这一快速发展领域的研究,厘清其设计空间,并强调未来的开放挑战。

查看 arXiv 页面(https://arxiv.org/abs/2606.09032)| 查看 PDF(https://arxiv.org/pdf/2606.09032)| GitHub5(https://github.com/sustech-nlp/awesome-text-world-models)| 添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2606.09032)

在您的智能体中获取本文:

hf papers read 2606\.09032

没有最新命令行工具?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用本文的模型(0)

暂无模型引用本文

请在一个模型的 README.md 中引用 arxiv.org/abs/2606.09032,以便从本页面链接该模型。

引用本文的数据集(0)

暂无数据集引用本文

请在一个数据集的 README.md 中引用 arxiv.org/abs/2606.09032,以便从本页面链接该数据集。

引用本文的空间(0)

暂无空间引用本文

请在一个空间的 README.md 中引用 arxiv.org/abs/2606.09032,以便从本页面链接该空间。

包含本文的收藏(1)

相似文章

机器人学习中的世界模型:全面综述

Hugging Face Daily Papers

本综述全面回顾了机器人学习中世界模型的文献,涵盖其在策略学习、规划和模拟中的作用。文章突出了预测建模在具身智能体中的关键范式、基准测试及未来发展方向。