标签
本文提出了一种面向自动驾驶的不确定性感知强化学习框架,通过自适应不确定性阈值和承诺-冷却策略引导的专家建议,提升了安全性和效率。在CARLA模拟器上的实验表明,相较于IQN基线,成功率提高了5%-7%。
BELIEF是一个面向生物医学问答的结构化证据建模与不确定性感知融合框架,它将检索到的文档转化为证据对象,并结合符号化Dempster-Shafer推理与基于LLM的推理。在PubMedQA、MedQA和MedMCQA上的实验表明,BELIEF在大多数设置下取得了最先进的结果。
ScreenSearch 引入了一个用于歧义感知桌面探索的系统,结合了结构化屏幕检索与去重技术,以及一个基于 PUCT 的图赌臂算法,用于处理 GUI 代理中的部分可观测性。该系统在 11 个应用中收集了超过 100 万张截图,并展示了探索策略中新颖性与歧义性之间的权衡。
PRISM是一个基于扩散的文本图像超分辨率框架,利用流匹配先验纠正和不确定性感知残差编码来提升严重退化下的准确性,实现了毫秒级推理的最新性能。