标签
本文提出了一种用于在线强化学习的分位数贝叶斯风险感知MDP框架,该框架能够随时间自适应地平衡鲁棒性与探索,提供了理论遗憾界并展示了强大的实证性能。
本文研究了Neutrosophic Logic作为大语言模型中认知状态建模的框架,证明了它能够捕捉超越传统概率约束的'hyper-truth'状态,从而带来更透明、更具伦理意识的AI系统。
本文开发了一种用于测试时自适应的PAC-贝叶斯框架,该框架使用MMD球作为信度集,提供了形式化的泛化界,并在分布偏移下区分认知不确定性与偶然不确定性。
本文介绍了GOEN,一种结合多尺度特征、L2归一化和马氏距离的OOD检测流水线,并发现CenterLoss正则化虽然提高了分类准确率,但实际上会降低OOD性能。
MIT研究人员开发了一种新方法,通过衡量相似模型间的跨模型分歧来识别过度自信的LLM,而非仅依赖自洽性指标。该方法能更好地捕捉认知不确定性,并在高风险应用中更准确地识别出不可靠的预测。