tool-augmented-llm

标签

Cards List
#tool-augmented-llm

ToolMenuBench:对可靠高效LLM代理的工具菜单过滤策略进行基准测试

arXiv cs.AI · 2026-06-16 缓存

ToolMenuBench是一个用于评估多步骤LLM代理中工具菜单过滤策略的基准测试。它表明,与未过滤的暴露相比,因果最小工具过滤显著提高了任务成功率并减少了Token使用量。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈