non-autoregressive

#non-autoregressive

通过熵门控连续比特流扩散缩小语言建模中的自回归差距

arXiv cs.CL ↗ · 2天前缓存

本文介绍了一种扩散语言模型，将文本视为二进制比特流上的连续过程，利用熵门控随机采样来缩小与自回归模型的性能差距。该模型在 LM1B 和 OWT 基准测试中取得了最先进的结果，同时降低了内存占用。

0 人收藏 0 人点赞

#non-autoregressive

X AI KOLs Following ↗ · 4天前缓存

Meta 的 FAIR 团队发布了 Flowception 的代码，这是 CVPR 2026 的一篇论文，介绍了一种非自回归视频生成框架。该框架通过交错帧插入与连续去噪，减少了误差累积和计算成本。

0 人收藏 0 人点赞

#non-autoregressive

Hugging Face Daily Papers ↗ · 6天前缓存

Cola DLM 是一种分层潜在扩散语言模型，它通过文本到潜空间的映射以及条件解码，实现高效且非自回归的文本生成。

0 人收藏 0 人点赞

#non-autoregressive

arXiv cs.CL ↗ · 2026-04-20 缓存

CRoCoDiL提出了一种用于语言的连续且鲁棒的条件扩散方法，将掩码扩散模型转移到连续语义空间中，相比LLaDA等离散方法，生成质量更优，采样速度快10倍。

0 人收藏 0 人点赞