faithful-calibration

标签

Cards List
#faithful-calibration

@dair_ai: 来自谷歌的新研究。LLMs 以高置信度产生幻觉,忽视自身知识边界,并错误报告不确定性…

X AI KOLs Timeline · 7小时前 缓存

一篇新的研究论文介绍了 RLMF(Reinforcement Learning with Metacognitive Feedback),一种两阶段方法,利用模型自身的自我判断来校准置信度并忠实地表达不确定性,在保持准确性的同时,在多种任务上实现了最先进的校准,并且比标准 RL 提升了高达 63%。

0 人收藏 0 人点赞
#faithful-calibration

基于元认知反馈的强化学习激发大语言模型中的忠实不确定性表达

Hugging Face Daily Papers · 2天前 缓存

本文介绍了基于元认知反馈的强化学习(RLMF)和元认知数据选择,以改进大语言模型的校准,实现内部不确定性的忠实表达,并比标准强化学习提升高达63%。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈