trajectory-synthesis

#trajectory-synthesis

演示TOFFEE：一个大规模合成数据代理轨迹的学习系统

arXiv cs.AI ↗ · 2026-07-08 缓存

TOFFEE是一个系统，它采用带有自适应模型选择和跨任务前缀重用的蒙特卡洛树搜索（Monte Carlo Tree Search），大规模合成高质量的数据代理轨迹。这些轨迹可用于微调或上下文学习，以提升数据代理在异构企业环境中的性能。

0 人收藏 0 人点赞

#trajectory-synthesis

arXiv cs.AI ↗ · 2026-07-01 缓存

提出了Agentic-Ideation框架，用于高效合成智能体轨迹以训练LLMs进行科学构想，实现了超过10倍的样本效率提升，并优于现有的基于工作流的基线方法。

0 人收藏 0 人点赞

#trajectory-synthesis

arXiv cs.CL ↗ · 2026-06-03 缓存

本文提出WRIT，一种用于合成多轮代理训练轨迹的流水线，该流水线平衡了写密集型与读重复杂度。该方法生成多样化的任务和模拟，使小型模型能够以更低的推理成本实现强大性能。

0 人收藏 0 人点赞

#trajectory-synthesis

Hugging Face Daily Papers ↗ · 2026-05-28 缓存

引入GUI-RobustEval（一个用于GUI代理错误恢复的基准）和鲁棒性驱动轨迹合成（RoTS）以生成训练数据，在OSWorld上达到当前最佳性能。

0 人收藏 0 人点赞

#trajectory-synthesis

Hugging Face Daily Papers ↗ · 2026-05-18 缓存

EnvFactory 自动化创建可执行工具环境和自然的多轮轨迹，用于训练具有智能体强化学习能力的大语言模型，在使用比先前工作更少的环境下，在 BFCLv3 和 MCP-Atlas 等基准测试上取得了优异性能。

0 人收藏 0 人点赞

#trajectory-synthesis

Papers with Code Trending ↗ · 2026-03-17 缓存

OpenResearcher 提出了一种可复现的流水线，用于使用离线搜索环境和合成轨迹训练深度研究智能体，在 BrowseComp-Plus 等基准任务上实现了显著的准确率提升。

0 人收藏 0 人点赞