@Zhongyi_Zhou_: ML通过数学梯度优化;循环工程需要文本“梯度”!介绍ToolGrad:一个智能体框架…

X AI KOLs Timeline 论文

摘要

介绍ToolGrad,一个智能体框架,通过文本‘梯度’生成、评估和优化工具使用轨迹,达到近乎100%的通过率,降低数据集生成成本。已被ACL 2026接收。

ML通过数学梯度优化;循环工程需要文本“梯度”! 介绍ToolGrad:一个持续生成、评估和优化工具使用轨迹的智能体框架,使用文本“梯度”。#ACL2026 🧵👉 https://t.co/NchvosrTr0 https://t.co/qm5wHXZJml
查看原文
查看缓存全文

缓存时间: 2026/06/17 20:03

ML通过数学梯度进行优化;循环工程需要文本“梯度“!

隆重推出 ToolGrad:一个智能体框架,能够持续生成、评估和优化工具使用轨迹,并利用文本“梯度“。 #ACL2026

🧵👉 https://t.co/NchvosrTr0 https://t.co/qm5wHXZJml


利用文本“梯度“高效生成工具使用数据集

来源:https://zhongyi-zhou.github.io/toolgrad/ 1Google2东京大学3RIKEN AIP4东北大学

ACL 2026 Findings

ToolGrad 预告图

ToolGrad 颠覆了工具使用数据生成流程。我们采用“答案优先“的工具使用数据生成框架,实现了接近100%的通过率和更低成本。

ToolGrad

与 ML 和 TextGrad 的类比

与 ML 和 TextGrad 的类比

智能体框架设计

智能体框架设计

BibTeX

@article{zhou2025toolgrad, title={ToolGrad: Efficient Tool-use Dataset Generation with Textual “Gradients”}, author={Zhongyi Zhou and Kohei Uehara and Haoyu Zhang and Jingtao Zhou and Lin Gu and Ruofei Du and Zheng Xu and Tatsuya Harada}, year={2025}, archivePrefix={arXiv}, }

相似文章

通过隐式梯度传输加速基于 LMO 的优化

arXiv cs.LG

本文提出了 LMO-IGT,这是一类新的随机优化方法,它利用隐式梯度传输来加速收敛,同时保持每次迭代仅计算一次梯度的结构。文中引入了一个统一的理论框架,并展示了相较于 Muon 等现有基于 LMO 的优化器,该方法具有更优的性能。

基于稀疏查询特征梯度优化的导向生成

arXiv cs.LG

本文介绍了Prototype-Based Sparse Steering方法,该方法将稀疏自编码器应用于大语言模型的注意力查询激活,然后在推理过程中使用梯度优化来引导生成朝向目标行为。该方法在一个逻辑规划任务和一个风格化教育领域中得到了验证,展示了可解释且解耦的控制能力。