generation-quality

标签

Cards List
#generation-quality

@nathanrs: 新帖子!扩散LLM的一个缺点是双向注意力机制导致键值跨步骤漂移,破…

X AI KOLs Timeline · 昨天 缓存

一篇新帖子强调了扩散LLM的一个缺点:双向注意力机制导致键值跨步骤漂移,破坏了KV缓存。不过,生成质量对轻微的KV漂移具有鲁棒性,研究重点已放在最大化陈旧KV重用而不导致质量下降上。

0 人收藏 0 人点赞
#generation-quality

ELF:嵌入式语言流

Hugging Face Daily Papers · 2026-05-11 缓存

ELF提出了一种基于嵌入空间和流匹配的连续扩散语言模型,在更少的采样步骤下性能优于现有的离散和连续扩散语言模型。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈