标签
本文提出测地线流匹配(Geodesic Flow Matching),一种在环面流形上对空间语义指针(SSP)进行去噪的黎曼传输方法,并在脉冲神经SLAM系统中实现了72%的跟踪误差降低和40%的效率提升。
本文介绍了时空并行解码(TSPD)和置信度外推(CE),通过动态判断令牌何时收敛并预测logit趋势,来加速基于扩散的大语言模型的推理,减少不必要的去噪步骤,同时保持输出质量。
重新审视统一扩散模型,指出了插入式ELBO与交叉熵去噪目标之间的不匹配,并提出了留一法参数化以及吸收态重表述,该方法无需额外训练即可提升生成质量。
本文指出了现有扩散语言模型强化学习方法中的弱点——缺乏时间信用分配和偏差似然估计——并提出了DACA-GRPO,一种即插即用的增强方案,引入了去噪进度分数和分层掩码似然,在推理、代码生成和受约束生成等多个基准上取得了一致的改进。
本文介绍了一种三角化无关的流匹配方法,用于基于网格的信号生成,采用Matérn过程作为噪声,PoissonNet作为去噪器,在大型网格上实现了高质量结果。
本文提出了一种新的用于线性逆问题的基于能量的模型,该模型学习归一化后验密度,克服了扩散模型的局限性。它实现了无偏采样、自适应采样和盲退化估计,在ImageNet、CelebA和AFHQ上具有竞争力的性能。
本文提出 Sphere Latent Encoder,一种高效的少步图像生成框架,该框架完全在球面潜空间中进行去噪,能够在 ImageNet-1K 上以显著降低的计算成本生成高质量 256×256 图像,并提升 FID 分数。
本文介绍了安全感知去噪器(SAD),这是一个在去噪过程中将安全约束整合到文本扩散模型中的框架。其目标是在保持生成质量的同时减少不安全内容的生成,填补了非自回归模型安全研究领域的空白。
本文介绍了DAWN,一种用于世界-动作交互模型(WAIMs)的潜在生成基线,通过递归细化联合建模场景演化与动作生成,在自动驾驶场景中实现了强大的长时域规划性能。
本文提出了JuRe(Just Repair,意为“仅需修复”),一个用于时间序列异常检测的极简去噪网络。该网络在TSB-AD和UCR基准数据集上的性能匹配或超越了复杂的神经网络基线模型,表明正确的流形投影训练目标比架构复杂度更为重要。
# 论文页面 - 阐明扩散概率模型的SNR-t偏差 来源:[https://huggingface.co/papers/2604.16044](https://huggingface.co/papers/2604.16044) ## 摘要 扩散概率模型在推理阶段存在SNR-timestep偏差,本文提出一种微分校正方法,对频率分量分别处理,以极低计算代价提升多种模型的生成质量。 [扩散概率模型](https://hugg