hypothesis-lock-in

#hypothesis-lock-in

推理中的校准漂移：Chain-of-Thought 预算如何导致大型语言模型过度自信

arXiv cs.CL ↗ · 5天前缓存

本文识别了推理中的校准漂移（CDUR），即增加思维链推理预算会导致大型语言模型在错误答案上系统性地过度自信，并提出了一个假设锁定模型（Hypothesis Lock-In）和一个校准感知的停止规则（CABStop）来缓解该问题。

0 人收藏 0 人点赞