environment-synthesis

标签

Cards List
#environment-synthesis

EnvFactory:通过可执行环境合成与鲁棒强化学习扩展工具使用智能体

Hugging Face Daily Papers · 2026-05-18 缓存

EnvFactory 自动化创建可执行工具环境和自然的多轮轨迹,用于训练具有智能体强化学习能力的大语言模型,在使用比先前工作更少的环境下,在 BFCLv3 和 MCP-Atlas 等基准测试上取得了优异性能。

0 人收藏 0 人点赞
#environment-synthesis

学习构建环境:通过可验证环境合成实现自我进化推理强化学习

Hugging Face Daily Papers · 2026-05-14 缓存

本文提出EvoEnv,一种让语言模型通过强化学习构建可验证的Python环境以实现自我改进的方法,在Qwen3-4B-Thinking上取得了3.3%的相对提升。

0 人收藏 0 人点赞
#environment-synthesis

EnvScaler:通过程序综合为LLM智能体扩展工具交互环境

arXiv cs.CL · 2026-04-20 缓存

EnvScaler是一个自动化框架,通过程序综合为LLM智能体扩展工具交互环境,创建了191个多样化环境和7K个场景,以提升智能体在多轮、多工具交互任务上的性能。

0 人收藏 0 人点赞
#environment-synthesis

Agent-World:面向演进式通用智能体的现实世界环境合成扩展

Hugging Face Daily Papers · 2026-04-20 缓存

# 论文页面 - Agent-World: Scaling Real-World Environment Synthesis for Evolving General Agent Intelligence 来源:[https://huggingface.co/papers/2604.18292](https://huggingface.co/papers/2604.18292) 发布于 4 月 20 日 · 提交者[https://huggingface.co/dongguanting](https://huggingface.co/dongguanting) [![](https://cdn-avatars.huggingface.co/v1/production/uploads/61cd4b833dd34ba1985e0753/BfHfrwotoMESpXZOHiIe4.png)](https://huggingface.co/dongguanting) [KABI](https://huggingface.co/donggua

0 人收藏 0 人点赞
← 返回首页

提交意见反馈