摊销因子推理网络用于后验推理

arXiv cs.LG 2026/05/27 04:00 论文

摘要

提出了摊销因子推理网络（AFINs），这是一类编码-合并-解码推理网络，能够泛化到不同的先验、似然和维度，在计算量少得多的条件下实现与NUTS相当的后验精度。

arXiv:2605.26419v1 公告类型: 新论文摘要: 摊销推理承诺快速的测试时贝叶斯推理，但现有方法本质上局限于固定模型。将摊销扩展到未见过的模型通常需要重新训练或昂贵的测试时微调。在本文中，我们提出一个问题：是否有可能构建一个单一的推理网络，能够泛化到不同的先验、似然和维度？我们引入了摊销因子推理网络（AFINs），这是一类基于维度无关模块的编码-合并-解码推理网络，将模型规范及其观测映射到变分后验的参数。实验上，单个训练好的AFIN实现了与NUTS和多种变分推理方法相当的后验精度，而所需的测试时计算量减少了2到4个数量级。代码可在 https://github.com/joohwanko/AFINs 获取。

查看原文

查看缓存全文

缓存时间: 2026/05/27 09:10

# 摊销因子推理网络用于后验推理
来源: https://arxiv.org/abs/2605.26419
查看PDF (https://arxiv.org/pdf/2605.26419)

> 摘要:摊销推理承诺快速测试时的贝叶斯推理，但现有方法本质上依赖于固定模型。将摊销扩展到未见过的模型通常需要重新训练或昂贵的测试时微调。本文提出一个问题：是否可能构建一个单一的推理网络，能够跨不同的先验、似然和维度进行泛化？我们引入了摊销因子推理网络（AFINs），这是一类编码-合并-解码推理网络，基于维度无关模块构建，将模型规范及其观测数据映射到变分后验的参数。实验表明，单个训练好的AFIN在多个任务上的后验精度可与NUTS及多种变分推理方法相媲美，同时测试时计算量降低2到4个数量级。代码可在以下URL获取：https://github.com/joohwanko/AFINs (https://github.com/joohwanko/AFINs)。

## 提交历史

来自：Joohwan Ko [查看邮箱 (https://arxiv.org/show-email/04aa00f8/2605.26419)] **\[v1\]** 2026年5月26日星期二 01:15:10 UTC (443 KB)

摊销因子推理网络用于后验推理

相似文章

SurvivalPFN：通过上下文贝叶斯推断进行生存预测的摊销

PreFT：仅预填充微调以实现高效推理

当表格基础模型遇到策略性表格数据：一种先验对齐方法

InfoAtlas：用于零样本统计依赖估计的基础模型

AFUN：迈向功能性理解的可供性基础模型

提交意见反馈