mcmc

#mcmc

BayesPO: 基于并行回火梯度引导离散MCMC的贝叶斯提示优化

arXiv cs.CL ↗ · 6天前缓存

本文提出BayesPO，一种使用梯度引导离散MCMC与并行回火的贝叶斯提示优化框架，在指令归纳任务上提升了准确率。

0 人收藏 0 人点赞

#mcmc

arXiv cs.LG ↗ · 2026-07-14 缓存

介绍深度熵引导采样（DEGS），一种无需训练、测试时的方法，利用大语言模型中逐层熵崩塌来改善推理能力，无需强化学习训练，达到与RL后训练模型相竞争的结果。

0 人收藏 0 人点赞

#mcmc

arXiv cs.LG ↗ · 2026-06-10 缓存

本文提出熵引导幂采样（EGPS），一种无需训练和验证器的采样方法，提高了幂采样在增强基础语言模型推理中的效率。与标准Metropolis-Hastings采样相比，EGPS在MATH500、HumanEval和GPQA等基准测试上达到最佳或并列最佳准确率，同时实现高达12.6倍的加速。

0 人收藏 0 人点赞

#mcmc

Hugging Face Daily Papers ↗ · 2026-06-04 缓存

本文提出了一种四阶段方法，用于构建建模LLM推理过程的因果图，利用反事实增强实现稳定的因果发现，并提供透明、概念级的可解释性。

0 人收藏 0 人点赞

#mcmc

arXiv cs.LG ↗ · 2026-05-15 缓存

bde是一个Python包，通过MILE方法将基于采样的贝叶斯深度学习带给实践者，结合了JAX的速度和scikit-learn的API，用于表格监督学习任务。

0 人收藏 0 人点赞