faithful-calibration

#faithful-calibration

@dair_ai: 来自谷歌的新研究。LLMs 以高置信度产生幻觉，忽视自身知识边界，并错误报告不确定性…

X AI KOLs Timeline ↗ · 7小时前缓存

一篇新的研究论文介绍了 RLMF（Reinforcement Learning with Metacognitive Feedback），一种两阶段方法，利用模型自身的自我判断来校准置信度并忠实地表达不确定性，在保持准确性的同时，在多种任务上实现了最先进的校准，并且比标准 RL 提升了高达 63%。

0 人收藏 0 人点赞

#faithful-calibration

基于元认知反馈的强化学习激发大语言模型中的忠实不确定性表达

Hugging Face Daily Papers ↗ · 2天前缓存

本文介绍了基于元认知反馈的强化学习（RLMF）和元认知数据选择，以改进大语言模型的校准，实现内部不确定性的忠实表达，并比标准强化学习提升高达63%。

0 人收藏 0 人点赞

faithful-calibration

@dair_ai: 来自谷歌的新研究。LLMs 以高置信度产生幻觉，忽视自身知识边界，并错误报告不确定性…

基于元认知反馈的强化学习激发大语言模型中的忠实不确定性表达

提交意见反馈