bayesian

标签

Cards List
#bayesian

你确定吗?符号回归中不确定性量化的全面且易懂综述

arXiv cs.LG · 昨天 缓存

关于符号回归中不确定性量化的全面综述,回顾了频率学派、贝叶斯以及模型选择方法,以解决在现实决策过程中缺乏可靠性支持的问题。

0 人收藏 0 人点赞
#bayesian

PBSD:用于长时域信用分配的特权贝叶斯自蒸馏

Hugging Face Daily Papers · 昨天 缓存

PBSD提出了一种贝叶斯自蒸馏方法,将稀疏的最终奖励转化为经过校准的回合级信用信号,用于长时域智能体任务,从而改进策略学习与泛化能力。

0 人收藏 0 人点赞
#bayesian

Infra-Bayesian 强化学习智能体在最坏情况鲁棒性方面优于经典 RL

arXiv cs.LG · 2026-05-25 缓存

本文展示了首个 infra-Bayesian 强化学习智能体的实现,证明其在最坏情况遗憾上优于经典 RL,并能最优地处理纽科姆问题,为模型误设定下的鲁棒性迈出了一步。

0 人收藏 0 人点赞
#bayesian

大规模语言模型的概率归因

arXiv cs.CL · 2026-05-22 缓存

本文提出了一种与模型无关的基于概率的令牌归因度量,利用贝叶斯规则反转下一个令牌的对数概率,捕捉模型对令牌序列的内部表示,并通过熵分析提高可解释性。

0 人收藏 0 人点赞
#bayesian

通过卡尔曼滤波、克里金法和过程噪声的精确跟踪Transformer

arXiv cs.LG · 2026-05-20

本文介绍了贝叶斯滤波Transformer(BFT),它通过精度加权注意力和卡尔曼更新残差将不确定性引入Transformer,从而提升了序列推荐和有噪声大语言模型微调的性能。

0 人收藏 0 人点赞
#bayesian

学习线性逆问题的归一化能量模型

arXiv cs.LG · 2026-05-18 缓存

本文提出了一种新的用于线性逆问题的基于能量的模型,该模型学习归一化后验密度,克服了扩散模型的局限性。它实现了无偏采样、自适应采样和盲退化估计,在ImageNet、CelebA和AFHQ上具有竞争力的性能。

0 人收藏 0 人点赞
#bayesian

贝叶斯模型合并

arXiv cs.LG · 2026-05-14 缓存

介绍贝叶斯模型合并(BMM),这是一个即插即用的双层优化框架,用于将多个任务特定的专家模型合并为一个单一模型,在视觉和语言基准测试上实现了最先进的性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈