non-autoregressive

标签

Cards List
#non-autoregressive

改进的大型语言扩散模型

arXiv cs.CL · 3天前 缓存

iLLaDA是一个80亿参数的掩码扩散语言模型,具有完全双向注意力机制,从头开始在12万亿token上训练。与LLaDA相比,它在多个方面都有显著改进,并在多个基准测试上与Qwen2.5 7B保持竞争力。模型和代码已开源。

0 人收藏 0 人点赞
#non-autoregressive

扩散语言模型:实验分析

arXiv cs.AI · 2026-06-20 缓存

一项系统性的实验分析,评估了八种最先进的扩散语言模型在多个基准测试上的表现,分析了生成质量与计算效率之间的权衡。

0 人收藏 0 人点赞
#non-autoregressive

基于加权前瞻评分方法的流式ASR系统高效标点恢复

arXiv cs.CL · 2026-06-05 缓存

提出一种用于流式ASR标点恢复的非自回归评分方法,该方法保留输入转录,并在有限前瞻预算下优于基于提示和微调的基线。

0 人收藏 0 人点赞
#non-autoregressive

当信心误导:面向扩散语言模型的后缀锚定与锚邻域置信度调制

Hugging Face Daily Papers · 2026-05-27 缓存

研究人员提出一种名为“后缀锚定置信度调制”的无训练方法,通过解决EOT标记和过早解码的问题,改进扩散语言模型中基于置信度的解码。

0 人收藏 0 人点赞
#non-autoregressive

通过熵门控连续比特流扩散缩小语言建模中的自回归差距

arXiv cs.CL · 2026-05-11 缓存

本文介绍了一种扩散语言模型,将文本视为二进制比特流上的连续过程,利用熵门控随机采样来缩小与自回归模型的性能差距。该模型在 LM1B 和 OWT 基准测试中取得了最先进的结果,同时降低了内存占用。

0 人收藏 0 人点赞
#non-autoregressive

@__JohnNguyen__: 今天我们发布了 CVPR 2026 论文 Flowception 的代码。Flowception 在完全双向序列模型和自回归生成之间架起了桥梁……

X AI KOLs Following · 2026-05-09 缓存

Meta 的 FAIR 团队发布了 Flowception 的代码,这是 CVPR 2026 的一篇论文,介绍了一种非自回归视频生成框架。该框架通过交错帧插入与连续去噪,减少了误差累积和计算成本。

0 人收藏 0 人点赞
#non-autoregressive

连续潜在扩散语言模型

Hugging Face Daily Papers · 2026-05-07 缓存

Cola DLM 是一种分层潜在扩散语言模型,它通过文本到潜空间的映射以及条件解码,实现高效且非自回归的文本生成。

0 人收藏 0 人点赞
#non-autoregressive

CRoCoDiL: 用于语言的连续且鲁棒的条件扩散

arXiv cs.CL · 2026-04-20 缓存

CRoCoDiL提出了一种用于语言的连续且鲁棒的条件扩散方法,将掩码扩散模型转移到连续语义空间中,相比LLaDA等离散方法,生成质量更优,采样速度快10倍。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈