diffusion-language-model

标签

Cards List
#diffusion-language-model

我从零构建了一个扩散语言模型。它能写出语法完美的句子,但毫无意义,而这正是有趣之处。

Reddit r/AI_Agents · 2026-06-08

作者从零构建了Joey,一个1.7亿参数的掩码扩散语言模型,在FineWeb-Edu上训练并在DailyDialog上微调,由于容量限制,模型能生成流畅但不连贯的句子。该项目突出了与自回归LLM的差异,以及从构建和调试系统中获得的经验教训。

0 人收藏 0 人点赞
#diffusion-language-model

迈向光速文本生成:Nemotron-Labs扩散语言模型

Hugging Face Blog · 2026-05-23 缓存

NVIDIA推出Nemotron-Labs Diffusion,这是一系列扩散语言模型,可并行生成文本并迭代优化,从而提供更快的生成速度并支持修订之前的令牌。

0 人收藏 0 人点赞
#diffusion-language-model

@probablynotaz9: ICML 单作者论文警报:是否曾想用经典策略梯度对扩散 LLM 进行后训练,而无需……

X AI KOLs Following · 2026-05-09 缓存

这篇 ICML 单作者论文介绍了摊销式组相对策略优化(AGRPO),旨在为扩散语言模型实现高效的强化学习后训练。

0 人收藏 0 人点赞
#diffusion-language-model

Chainwash:扩散语言模型水印的多步重写攻击

arXiv cs.CL · 2026-05-08 缓存

本研究论文介绍了Chainwash,一种多步重写攻击,能够有效删除扩散语言模型(LLaDA-8B-Instruct)输出中的统计水印,经过五次链式重写后,检测率从87.9%降至4.86%。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈