摊销因子推理网络用于后验推理
摘要
提出了摊销因子推理网络(AFINs),这是一类编码-合并-解码推理网络,能够泛化到不同的先验、似然和维度,在计算量少得多的条件下实现与NUTS相当的后验精度。
arXiv:2605.26419v1 公告类型: 新论文
摘要: 摊销推理承诺快速的测试时贝叶斯推理,但现有方法本质上局限于固定模型。将摊销扩展到未见过的模型通常需要重新训练或昂贵的测试时微调。在本文中,我们提出一个问题:是否有可能构建一个单一的推理网络,能够泛化到不同的先验、似然和维度?我们引入了摊销因子推理网络(AFINs),这是一类基于维度无关模块的编码-合并-解码推理网络,将模型规范及其观测映射到变分后验的参数。实验上,单个训练好的AFIN实现了与NUTS和多种变分推理方法相当的后验精度,而所需的测试时计算量减少了2到4个数量级。代码可在 https://github.com/joohwanko/AFINs 获取。
查看缓存全文
缓存时间: 2026/05/27 09:10
# 摊销因子推理网络用于后验推理 来源: https://arxiv.org/abs/2605.26419 查看PDF (https://arxiv.org/pdf/2605.26419) > 摘要:摊销推理承诺快速测试时的贝叶斯推理,但现有方法本质上依赖于固定模型。将摊销扩展到未见过的模型通常需要重新训练或昂贵的测试时微调。本文提出一个问题:是否可能构建一个单一的推理网络,能够跨不同的先验、似然和维度进行泛化?我们引入了摊销因子推理网络(AFINs),这是一类编码-合并-解码推理网络,基于维度无关模块构建,将模型规范及其观测数据映射到变分后验的参数。实验表明,单个训练好的AFIN在多个任务上的后验精度可与NUTS及多种变分推理方法相媲美,同时测试时计算量降低2到4个数量级。代码可在以下URL获取:https://github.com/joohwanko/AFINs (https://github.com/joohwanko/AFINs)。 ## 提交历史 来自:Joohwan Ko [查看邮箱 (https://arxiv.org/show-email/04aa00f8/2605.26419)] **\[v1\]** 2026年5月26日星期二 01:15:10 UTC (443 KB)
相似文章
SurvivalPFN:通过上下文贝叶斯推断进行生存预测的摊销
SurvivalPFN 是一种先验数据拟合网络,通过上下文学习摊销生存分析的贝叶斯推断,在 61 个数据集上实现了强大的预测性能,无需特定任务训练或超参数调优。
PreFT:仅预填充微调以实现高效推理
PreFT 提出仅在预填充 token 上应用适配器,在解码阶段丢弃它们,从而在几乎不损失性能的情况下提高多适配器服务的吞吐量。
当表格基础模型遇到策略性表格数据:一种先验对齐方法
本文研究了基于预训练先验数据拟合网络的表格基础模型是否能够泛化到个体在部署后修改特征的策略性表格数据。提出了策略性先验数据拟合网络(SPN),这是一个无需重新训练即可将PFN预测与操纵后分布对齐的推理时框架。
InfoAtlas:用于零样本统计依赖估计的基础模型
InfoAtlas是一种基础模型,能够通过单次前向传播直接估算互信息,在保持准确性的同时,比传统神经估算器实现100倍加速。该模型在合成数据上预训练,并能泛化到现实场景。
AFUN:迈向功能性理解的可供性基础模型
AFUN 提出了一种可供性基础模型,该模型从 RGB-D 观测和语言描述中预测功能掩码和 3D 运动曲线,从而能够在多种环境中实现泛化的机器人操作。该模型在多个基准测试上优于基线方法,并且无需微调即可部署到实际任务中。