ownership-bias

#ownership-bias

大语言模型对其自身回应过度自信

Hugging Face Daily Papers ↗ · 2026-06-02 缓存

本文探究为何经过指令微调的大语言模型对其自身回应表现出过度自信，并识别出一种“所有权偏差”，即模型对自我生成的答案赋予更高置信度。文章提出一种简单的推理时策略，将模型答案重新表述为用户输入，无需重新训练即可将校准度提升高达26%。

0 人收藏 0 人点赞