masked-diffusion

#masked-diffusion

基于轨迹的在策略蒸馏用于掩码扩散语言模型

arXiv cs.CL ↗ · 昨天缓存

一篇论文提出了基于轨迹的在策略蒸馏（TOPD），一种教师监督框架，用于将推理能力迁移到掩码扩散语言模型，无需奖励估计，在显著的计算加速下实现了与经过RL训练的模型相当的准确率。

0 人收藏 0 人点赞

#masked-diffusion

强化多模态掩码扩散模型的生成顺序

arXiv cs.LG ↗ · 2026-07-10 缓存

本文提出了一种可学习的控制模块，通过组相对策略优化（GRPO）进行训练，以优化多模态掩码扩散模型中的生成顺序，从而在文本到图像对齐和多模态理解方面取得了改进。

0 人收藏 0 人点赞

#masked-diffusion

@volokuleshov: 新博客文章：如何构建扩散语言模型。扩散LLM从开放问题变为现实，用了2年时间 (Me…)

X AI KOLs Timeline ↗ · 2026-07-08 缓存

由Volodymyr Kuleshov的康奈尔团队撰写的综合博客文章，解释了如何构建扩散语言模型，涵盖了核心技术如掩码扩散、迭代细化、变长生成、可控生成、快速采样器和RL后训练，并以开源模型如Mercury、Gemma Diffusion和Nemotron Diffusion为例。

0 人收藏 0 人点赞

#masked-diffusion

掩码扩散解码作为$x$-预测流

arXiv cs.CL ↗ · 2026-06-30 缓存

本文重新将掩码扩散语言模型解码解释为连续干净状态预测，引入了一个基于流的框架，其中令牌根据置信度连续异步更新，在仅使用25%的解码预算下，达到了LLaDA性能的97%。

0 人收藏 0 人点赞

#masked-diffusion

掩码语言流模型

arXiv cs.CL ↗ · 2026-06-29 缓存

本文介绍了掩码语言流模型（MLFMs），该模型将掩码机制引入基于流的语言模型，从而实现连续流进行条件生成，并允许转换预训练的掩码扩散模型。作者提出了一种新型采样器，交替进行连续去噪和离散去掩码，首次证明了基于流的语言模型可以扩展至下游推理和指令遵循任务。

0 人收藏 0 人点赞

#masked-diffusion

改进的大型语言扩散模型

arXiv cs.CL ↗ · 2026-06-25 缓存

iLLaDA是一个80亿参数的掩码扩散语言模型，具有完全双向注意力机制，从头开始在12万亿token上训练。与LLaDA相比，它在多个方面都有显著改进，并在多个基准测试上与Qwen2.5 7B保持竞争力。模型和代码已开源。

0 人收藏 0 人点赞

#masked-diffusion

VoidPadding: 让[VOID]处理掩码扩散语言模型中的填充，使[EOS]专注于语义终止

arXiv cs.CL ↗ · 2026-06-17 缓存

VoidPadding引入了一个[VOID]标记来处理掩码扩散语言模型中的填充，使[EOS]能够仅专注于语义终止。该方法显著提升了推理和编码基准测试的性能，同时减少了解码步骤。

0 人收藏 0 人点赞

#masked-diffusion

现在谁主导解码？追踪 Masked Diffusion Language Models 集成中的可靠轨迹

Hugging Face Daily Papers ↗ · 2026-06-15 缓存

本文提出 TIE，一种面向 Masked Diffusion Language Models 的知识融合框架，通过追踪置信度动态来识别可靠解码轨迹，并在模型间迭代传输部分去噪序列，从而提升推理任务的生成质量。

0 人收藏 0 人点赞

#masked-diffusion

基于注意力折扣的自适应采样器用于掩码扩散语言模型

arXiv cs.CL ↗ · 2026-06-10 缓存

本文介绍了ADAS，一种无需训练的重排序规则，用于并行掩码扩散解码。它利用注意力对强烈关注不确定位置的token进行折扣，从而在低NFE设置下提升推理和代码任务的性能，且运行时开销极小。

0 人收藏 0 人点赞

#masked-diffusion

我从零构建了一个扩散语言模型。它能写出语法完美的句子，但毫无意义，而这正是有趣之处。

Reddit r/AI_Agents ↗ · 2026-06-08

作者从零构建了Joey，一个1.7亿参数的掩码扩散语言模型，在FineWeb-Edu上训练并在DailyDialog上微调，由于容量限制，模型能生成流畅但不连贯的句子。该项目突出了与自回归LLM的差异，以及从构建和调试系统中获得的经验教训。

0 人收藏 0 人点赞

#masked-diffusion

面向掩码扩散的自适应顺序策略

arXiv cs.LG ↗ · 2026-06-02 缓存

提出使用轻量级策略网络学习掩码扩散模型中的去掩码顺序，通过加权损失在组合任务和蛋白质设计上优于启发式方法。

0 人收藏 0 人点赞

#masked-diffusion

DLLM-JEPA：面向掩码扩散语言模型的联合嵌入预测架构

arXiv cs.CL ↗ · 2026-06-02 缓存

介绍了DLLM-JEPA，这是一种针对掩码扩散语言模型的JEPA公式，通过扩散噪声调度从单个输入构建两个视图，相比LLM-JEPA减少了33%的训练FLOPs，并在GSM8K等任务上提升了微调性能。

0 人收藏 0 人点赞

#masked-diffusion

置信捷径：掩码扩散模型的一种推理失效模式

arXiv cs.AI ↗ · 2026-05-29 缓存

本文识别了掩码扩散语言模型中的一种失效模式：基于置信度的解码在复杂推理任务中导致高置信度错误，并表明置信对齐训练会加剧此问题，而随机掩码则能保持推理性能。

0 人收藏 0 人点赞

#masked-diffusion