tradeoff

#tradeoff

验证者税：工具使用型LLM智能体中依赖于任务步数的安全与成功权衡 [R]

Reddit r/MachineLearning ↗ · 昨天

本文提出了一个用于工具使用型LLM智能体的安全评估框架，引入了“验证者税（Verifier Tax）”的概念——一种依赖于任务步数的安全与任务完成之间的权衡。文章提出了一种双层验证架构，并使用Tau-bench场景展示了验证如何减少不安全成功，但随着任务步数增加也会降低任务完成率。

0 人收藏 0 人点赞

#tradeoff

arXiv cs.LG ↗ · 2026-05-27 缓存

本文引入了'约束税'这一概念，即小语言模型中结构化输出约束导致的准确性损失，并提出了一种测量协议来量化有效性与正确性之间的权衡。

0 人收藏 0 人点赞