面向大型语言模型的智能体环境工程：环境建模、合成、评估与应用综述

Hugging Face Daily Papers 2026/06/10 00:00 论文

摘要

一篇关于面向大型语言模型的智能体环境工程的全面综述，涵盖环境建模、合成、评估与应用，重点聚焦于智能体与环境的协同演化。

环境作为基于大型语言模型（LLM）的智能体在多种场景下的交互系统，在推动模型能力持续演进方面发挥着关键作用。尽管这一重要性不言而喻，现有研究仍缺乏系统的分类与深入分析。本文从环境工程生命周期的视角，系统研究了当前智能体环境的相关工作，涵盖其建模、合成、评估与应用。具体而言，本文首先从八个属性和八个领域维度介绍了代表性环境，详细分析了它们的发展路径并突出了核心能力。其次，针对自动化环境合成，引入了两种范式——符号合成与神经合成，并展示了每种范式下的不同环境评估方法。第三，从智能体-环境协同演化的角度讨论了相应的环境应用。具体地，本文从四个互补视角描述了动态环境中智能体演化的主要路径：以记忆为中心的经验演化、以编排为中心的工作流演化、以轨迹为中心的离线演化以及以探索为中心的在线演化。同时，识别出三种环境演化范式，即神经驱动、难度驱动和规模驱动方法。最后，讨论了几个有前景的未来方向，包括环境即服务、多智能体环境以及神经符号环境。

查看原文

查看缓存全文

缓存时间: 2026/06/11 13:40

论文页面 - 面向大型语言模型的智能体环境工程：环境建模、合成、评估与应用综述

来源: https://huggingface.co/papers/2606.12191 作者:

摘要

大型语言模型智能体需要专门的环境进行训练和评估，这些环境可根据其工程生命周期阶段进行分类，并通过包括神经方法和符号方法在内的多种范式进行演进。

环境作为基于大型语言模型 (https://huggingface.co/papers?q=large%20language%20model)(LLM)的智能体在各类场景中的交互式系统，在推动模型能力持续演进方面发挥着关键作用。尽管这一重要性显而易见，但现有研究缺乏系统性的分类与深入分析。本文从环境工程生命周期 (https://huggingface.co/papers?q=environment%20engineering%20lifecycle)的角度，系统梳理了当前关于智能体环境 (https://huggingface.co/papers?q=agentic%20environments)的研究，涵盖其建模、合成、评估与应用。具体而言，本文首先从八个属性和八个领域出发介绍了代表性环境，详细分析了它们的发展路径并突出了其核心能力。其次，针对自动化环境合成，介绍了两种范式，即符号合成 (https://huggingface.co/papers?q=symbolic%20synthesis) 与神经合成 (https://huggingface.co/papers?q=neural%20synthesis)。本文还展示了每种范式下不同的环境评估方法。第三，讨论了从智能体-环境协同进化 (https://huggingface.co/papers?q=agent-environment%20co-evolution)视角出发的相应环境应用。具体而言，本文从四个互补角度描述了动态环境中智能体进化的主要路径：以记忆为中心的经验进化 (https://huggingface.co/papers?q=memory-centric%20experience%20evolution)、以编排为中心的工作流进化 (https://huggingface.co/papers?q=orchestration-centric%20workflow%20evolution)、以轨迹为中心的离线进化 (https://huggingface.co/papers?q=trajectory-centric%20offline%20evolution) 以及以探索为中心的在线进化 (https://huggingface.co/papers?q=exploration-centric%20online%20evolution)。并识别了三种环境进化范式，即神经驱动、难度驱动和规模驱动方法。最后，讨论了几个有前景的未来方向，包括环境即服务 (Environment-as-a-Service)、多智能体环境和神经符号环境 (Neural-Symbolic Environments)。

查看 arXiv 页面 (https://arxiv.org/abs/2606.12191) 查看 PDF (https://arxiv.org/pdf/2606.12191) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2606.12191)

引用本文的模型 0

没有模型关联此论文

请在模型 README.md 中引用 arxiv.org/abs/2606.12191 以从本页建立链接。

引用本文的数据集 0

没有数据集关联此论文

请在数据集 README.md 中引用 arxiv.org/abs/2606.12191 以从本页建立链接。

引用本文的 Spaces 0

没有 Space 关联此论文

请在 Space README.md 中引用 arxiv.org/abs/2606.12191 以从本页建立链接。

包含本文的收藏 0

没有包含此论文的收藏

请将这篇论文添加到收藏 (https://huggingface.co/new-collection) 中以从本页建立链接。

面向大型语言模型的智能体环境工程：环境建模、合成、评估与应用综述

论文页面 - 面向大型语言模型的智能体环境工程：环境建模、合成、评估与应用综述

摘要

引用本文的模型 0

引用本文的数据集 0

引用本文的 Spaces 0

包含本文的收藏 0

相似文章

EnvSimBench：用于评估和改善基于大语言模型的环境模拟的基准

EnvScaler：通过程序综合为LLM智能体扩展工具交互环境

从受训者到训练者：LLM为多智能体推理强化学习设计的训练环境

比人类更环保？大语言模型中的环境态度

@dair_ai: 一个LLM代理真的能构建它无法看到的环境模型吗？这项工作使这个问题可评分。一个代理…

提交意见反馈