trace-evaluation

标签

Cards List
#trace-evaluation

使用 Fireworks 构建成本降低 100 倍的轨迹评判器(7 分钟阅读)

TLDR AI · 6天前 缓存

LangChain 和 Fireworks 微调了 Qwen 模型,用于检测代理轨迹中的“感知错误”,实现了 100 倍成本降低,同时保持前沿性能。该评判器模型旨在用错误信号丰富轨迹,以监控代理系统。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈