epistemic-uncertainty

标签

Cards List
#epistemic-uncertainty

通过分位数贝叶斯风险MDP实现在线强化学习中鲁棒性与探索的动态权衡

arXiv cs.LG · 2026-05-26 缓存

本文提出了一种用于在线强化学习的分位数贝叶斯风险感知MDP框架,该框架能够随时间自适应地平衡鲁棒性与探索,提供了理论遗憾界并展示了强大的实证性能。

0 人收藏 0 人点赞
#epistemic-uncertainty

打破概率的枷锁:Neutrosophic Logic作为大语言模型中认知不确定性的新框架

arXiv cs.AI · 2026-05-26 缓存

本文研究了Neutrosophic Logic作为大语言模型中认知状态建模的框架,证明了它能够捕捉超越传统概率约束的'hyper-truth'状态,从而带来更透明、更具伦理意识的AI系统。

0 人收藏 0 人点赞
#epistemic-uncertainty

MMD球作为信度集:测试时自适应中认知不确定性的PAC-贝叶斯框架

arXiv cs.LG · 2026-05-22 缓存

本文开发了一种用于测试时自适应的PAC-贝叶斯框架,该框架使用MMD球作为信度集,提供了形式化的泛化界,并在分布偏移下区分认知不确定性与偶然不确定性。

0 人收藏 0 人点赞
#epistemic-uncertainty

不要压缩你的特征:为什么CenterLoss会损害OOD检测,而多尺度马氏距离胜出

arXiv cs.LG · 2026-05-22 缓存

本文介绍了GOEN,一种结合多尺度特征、L2归一化和马氏距离的OOD检测流水线,并发现CenterLoss正则化虽然提高了分类准确率,但实际上会降低OOD性能。

0 人收藏 0 人点赞
#epistemic-uncertainty

一种更优的识别大语言模型过度自信的方法

MIT News — Artificial Intelligence · 2026-03-19 缓存

MIT研究人员开发了一种新方法,通过衡量相似模型间的跨模型分歧来识别过度自信的LLM,而非仅依赖自洽性指标。该方法能更好地捕捉认知不确定性,并在高风险应用中更准确地识别出不可靠的预测。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈