perceived-error

#perceived-error

使用 Fireworks 构建成本降低 100 倍的轨迹评判器（7 分钟阅读）

TLDR AI ↗ · 6天前缓存

LangChain 和 Fireworks 微调了 Qwen 模型，用于检测代理轨迹中的“感知错误”，实现了 100 倍成本降低，同时保持前沿性能。该评判器模型旨在用错误信号丰富轨迹，以监控代理系统。

0 人收藏 0 人点赞

#perceived-error

X AI KOLs Timeline ↗ · 6天前缓存

LangChain Labs与Fireworks AI联合研究表明，通过微调开源Qwen模型，可以创建一个能够检测生产轨迹中“感知错误”的轨迹判断器，且该模型在以最高降低100倍成本的同时达到前沿性能。该模型在两个内部数据集上进行了评估，并显示出跨应用的通用性。

0 人收藏 0 人点赞