TRACER:基于追踪的自适应成本高效路由用于LLM分类
摘要
TRACER是一个开源系统,它在LLM分类端点的生产追踪数据上训练轻量级机器学习代理,并通过一个一致性门控路由请求,仅当代理与原始模型的一致性超过指定阈值时才激活代理。该方法在意图分类基准上实现了83-100%的代理覆盖率,同时保持了对处理边界和故障模式的可解释性。
查看缓存全文
缓存时间: 2026/04/20 08:27
论文页面 - TRACER:基于追踪的自适应成本高效分类路由系统
来源:https://huggingface.co/papers/2604.14531
摘要
TRACER 是一个开源系统,它利用生产环境追踪数据训练 LLM 分类任务的机器学习替代模型,仅当替代模型与原始模型的一致性超过指定阈值时才激活它,同时提供可解释性,以清晰界定处理边界。
每次调用 LLM 分类端点都会产生一个已标注的输入-输出对,这些数据已存在于生产日志中。这些对构成了一个免费且不断增长的训练集:在其上训练的轻量级替代模型可以吸收未来很大一部分流量,且边际推理成本近乎为零。待解决的关键问题是:替代模型何时足够可靠以部署、它能处理哪些任务而将哪些任务推迟、以及随着数据积累这种边界如何演变。我们提出了 TRACER(Trace-based Adaptive Cost-Efficient Routing,基于追踪的自适应成本高效路由),这是一个开源系统,它在 LLM 自身生产追踪数据上训练机器学习替代模型,并通过一致性门控机制 控制部署:仅当替代模型与 LLM 的一致性超过用户指定阈值 α 时才激活它。为了使路由边界透明化,TRACER 会生成可解释性产物,描述替代模型处理哪些输入区域、在哪些区域表现趋于平稳、以及为何选择推迟处理。在采用 Sonnet 4.6 教师模型的 77 类意图基准测试上,根据质量目标 α 的不同,TRACER 实现了 83% 到 100% 的替代模型覆盖率;在 150 类基准测试上,替代模型完全取代了教师模型。在自然语言推理任务中,一致性门控机制正确拒绝了替代模型的部署,因为嵌入表示无法支持可靠的分类分离。该系统已作为开源软件发布。
查看 arXiv 页面 (https://arxiv.org/abs/2604.14531)查看 PDF (https://arxiv.org/pdf/2604.14531)项目页面 (https://www.tracer.deeprecall.io/)GitHub131 (https://github.com/adrida/tracer)添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2604.14531)
在你的 AI 智能体中获取这篇论文:
hf papers read 2604.14531
没有最新命令行工具?curl -LsSf https://hf.co/cli/install.sh | bash
引用该论文的模型(0)
暂无模型关联此论文
在模型的 README.md 中引用 arxiv.org/abs/2604.14531 即可从此页面建立链接。
引用该论文的数据集(0)
暂无数据集关联此论文
在数据集的 README.md 中引用 arxiv.org/abs/2604.14531 即可从此页面建立链接。
引用该论文的 Space(0)
暂无 Space 关联此论文
在 Space 的 README.md 中引用 arxiv.org/abs/2604.14531 即可从此页面建立链接。
收录该论文的收藏集(0)
暂无收藏集收录此论文
将此论文添加到一个收藏集中 (https://huggingface.co/new-collection) 即可从此页面建立链接。
相似文章
@tom_doerr: 用传统机器学习替代90%的LLM分类调用 https://github.com/adrida/tracer
TRACER是一种工具,通过从LLM痕迹中学习,用轻量级传统机器学习替代多达90%的LLM分类调用,降低成本同时保持准确性。
TRACE:面向LLM智能体的自适应跨步证据聚合轨迹推理
TRACE是一个用于长周期LLM智能体轨迹的监控框架,它通过分诊-检查-判断(Triage-Inspect-Judge)循环来连接时间上相隔较远的动作证据,在规避性破坏检测任务上实现了高召回率和F1值。
推理流如何运作?追踪注意力诱导信息流以在LLM中进行定向强化学习
FlowTracer是一个强化学习框架,它利用注意力诱导图来追踪推理流并分配词元级别的信用,从而提升推理任务的性能。
从早期经验中学习智能体路由
本文介绍了 BoundaryRouter,这是一个无需训练的框架,通过根据早期经验将查询路由至轻量级推理或完整智能体执行来优化大型语言模型(LLM)智能体的使用。此外,本文还提出了 RouteBench,这是一个用于评估路由性能的基准,显示出在速度和准确率方面的显著提升。
TRACER:面向交通事故重建的免训练闭环结构化推理
TRACER是一个用于交通事故重建的免训练框架,它将问题表述为闭环结构化推理,通过迭代优化基于事件的运动假设,并施加几何和运动学约束,从而比数据驱动和基于物理的基线方法获得更高的保真度和一致性。