tool-agents

标签

Cards List
#tool-agents

WRIT:面向多轮用户代理的写读密集型轨迹合成

arXiv cs.CL · 2026-06-03 缓存

本文提出WRIT,一种用于合成多轮代理训练轨迹的流水线,该流水线平衡了写密集型与读重复杂度。该方法生成多样化的任务和模拟,使小型模型能够以更低的推理成本实现强大性能。

0 人收藏 0 人点赞
#tool-agents

GTA-2:从原子工具使用到开放式工作流的通用工具Agent基准测试

Hugging Face Daily Papers · 2026-04-17 缓存

GTA-2 引入了一个分层基准,用于评估通用工具Agent在原子工具使用和开放式工作流中的表现,揭示了显著的能力鸿沟:前沿模型在复杂任务上仅取得14.39%的成功率,尽管在原子任务上表现尚可。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈