现在谁主导解码?追踪 Masked Diffusion Language Models 集成中的可靠轨迹
摘要
本文提出 TIE,一种面向 Masked Diffusion Language Models 的知识融合框架,通过追踪置信度动态来识别可靠解码轨迹,并在模型间迭代传输部分去噪序列,从而提升推理任务的生成质量。
查看缓存全文
缓存时间: 2026/06/16 11:34
论文页面 - 现在该由谁来主导解码?追踪可靠轨迹以实现掩码扩散语言模型的集成
来源:https://huggingface.co/papers/2606.16281
摘要
掩码扩散语言模型展现出独特的解码动态,其中可靠轨迹呈现稳定的置信度模式,使得能够基于置信度演化,在不同模型之间传递部分去噪序列的迭代集成方法成为可能。
掩码扩散语言模型 (https://huggingface.co/papers?q=Masked%20Diffusion%20Language%Models)(MDLM)已成为序列生成领域一种独特的范式。随着MDLM在能力和知识覆盖范围上日益多样化,一个关键问题是如何整合它们所拥有的知识。为此,我们首先研究了MDLM独特的解码动态 (https://huggingface.co/papers?q=decoding%20dynamics)。我们发现,成功的生成过程在回答相关位置上表现出稳定的置信度动态 (https://huggingface.co/papers?q=confidence%20dynamics),而不可靠的轨迹则通常可以通过注入来自其他模型的更有前景的中间状态来纠正。基于这一观察,我们提出了TIE(基于轨迹的迭代集成 (https://huggingface.co/papers?q=Trajectory-based%20Iterative%20Ensembling)),这是一个知识融合框架,其中MDLM迭代地识别可靠的解码轨迹并在模型间进行接力传递。TIE追踪回答相关位置上的置信度动态 (https://huggingface.co/papers?q=confidence%20dynamics),以判断当前哪个模型遵循更可靠的轨迹,并选择性地在模型间传递部分去噪序列 (https://huggingface.co/papers?q=partially%20denoised%20sequences)。由于遵循更有前景轨迹的模型往往会在不同的去噪步骤 (https://huggingface.co/papers?q=denoising%20steps) 中发生变化,TIE允许不同模型在生成的不同阶段贡献其互补的优势。在多种推理任务上的强劲表现,以及我们的分析表明,TIE为MDLM集成这一尚未充分探索的问题提供了一种实用的方法。
查看 arXiv 页面 (https://arxiv.org/abs/2606.16281) 查看 PDF (https://arxiv.org/pdf/2606.16281) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2606.16281)
在您的 agent 中获取此论文:
hf papers read 2606\.16281
没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用此论文的模型0
没有模型链接到此论文
请在模型 README.md 中引用 arxiv.org/abs/2606.16281 以从本页面链接。
引用此论文的数据集0
没有数据集链接到此论文
请在数据集 README.md 中引用 arxiv.org/abs/2606.16281 以从本页面链接。
引用此论文的 Spaces0
没有 Space 链接到此论文
请在 Space README.md 中引用 arxiv.org/abs/2606.16281 以从本页面链接。
收录此论文的收藏集0
没有收藏集包含此论文
请将此论文添加到一个收藏集 (https://huggingface.co/new-collection) 中以从本页面链接。
相似文章
基于时空并行解码与置信度外推的高效扩散LLMs
本文介绍了时空并行解码(TSPD)和置信度外推(CE),通过动态判断令牌何时收敛并预测logit趋势,来加速基于扩散的大语言模型的推理,减少不必要的去噪步骤,同时保持输出质量。
掩码扩散解码作为$x$-预测流
本文重新将掩码扩散语言模型解码解释为连续干净状态预测,引入了一个基于流的框架,其中令牌根据置信度连续异步更新,在仅使用25%的解码预算下,达到了LLaDA性能的97%。
# 支持性令牌揭示:用于快速扩散语言模型解码
本文提出了 AXON,一种无需训练的模块,通过智能选择"锚点"(anchor)token 优先揭示,并利用注意力、不确定性和置信度信号来辅助后续去噪步骤,从而改善离散扩散语言模型解码的质量-延迟权衡。在推理和代码生成基准测试上的实验表明,AXON 在保持或提升准确率的同时减少了函数评估次数。
置信捷径:掩码扩散模型的一种推理失效模式
本文识别了掩码扩散语言模型中的一种失效模式:基于置信度的解码在复杂推理任务中导致高置信度错误,并表明置信对齐训练会加剧此问题,而随机掩码则能保持推理性能。
Speculative Refinement: 一种混合自回归扩散解码策略及其在不同基准测试中的行为表现
介绍了 Speculative Refinement (SpecRef),一种无需训练的混合解码策略,它通过熵引导的选择性掩码,从自回归草稿中热启动掩码扩散语言模型。在六个基准测试上的评估表明,代码基准测试混淆了结构发现与逻辑正确性,识别出了一种精炼张力现象,并显示评估协议可能产生不同的模型排名。