scientific-validity

标签

Cards List
#scientific-validity

长周期研究智能体的搜索纪律

arXiv cs.AI · 16小时前 缓存

本文识别了长周期研究智能体中的一种失败模式:优化聚合指标可能选出提升核心数字但破坏关键子群体(反转)的候选项。它提出了一种搜索纪律协议,该协议使用一个外部控制环路,基于候选项的分解行为而非得分进行审计。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈