evidence-aggregation

标签

Cards List
#evidence-aggregation

TRACE:面向LLM智能体的自适应跨步证据聚合轨迹推理

arXiv cs.CL · 昨天 缓存

TRACE是一个用于长周期LLM智能体轨迹的监控框架,它通过分诊-检查-判断(Triage-Inspect-Judge)循环来连接时间上相隔较远的动作证据,在规避性破坏检测任务上实现了高召回率和F1值。

0 人收藏 0 人点赞
#evidence-aggregation

Skill-RM: 通过智能体技能统一异构评估标准

Hugging Face Daily Papers · 2026-06-02 缓存

Skill-RM 提出了一种统一的奖励建模框架,将奖励计算视为结构化的智能体任务,实现了动态证据聚合和跨多种应用的一致评估,优于传统的评判基线。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈