autoregressive-decoding

标签

Cards List
#autoregressive-decoding

先想象后预测:用于视频事件预测的交错潜在视觉推理

Hugging Face Daily Papers · 2天前 缓存

介绍了Future-L1,一种交错潜在视觉推理框架,通过在潜在空间中保持视觉语义来改进视频事件预测。在FutureBench和TwiFF-Bench基准上取得了最先进的结果。

0 人收藏 0 人点赞
#autoregressive-decoding

KVarN:方差归一化的KV缓存量化减轻推理任务中的错误累积

Hugging Face Daily Papers · 4天前 缓存

KVarN是一个免校准的KV缓存量化器,它使用哈达玛旋转和双缩放方差归一化来减少大型语言模型自回归解码过程中的错误累积,在推理基准上实现了最先进的2位精度。

0 人收藏 0 人点赞
#autoregressive-decoding

@NVIDIAAI: 大多数语言模型一次只生成一个token。我们刚刚发布了Nemotron-Labs-Diffusion,一个扩散语言模型系列…

X AI KOLs Following · 2026-05-19 缓存

NVIDIA发布了Nemotron-Labs-Diffusion,这是一个扩散语言模型系列,可以并行生成多个token,从而实现更快的推理和更好的GPU利用率,模型规模从3B到14B,包括视觉语言变体。

0 人收藏 0 人点赞
#autoregressive-decoding

BitLM:利用位级连续扩散解锁多 Token 语言生成

arXiv cs.CL · 2026-05-13 缓存

本文介绍了 BitLM,一种利用位级连续扩散并行生成多个 Token 的语言模型,旨在克服传统自回归生成的顺序瓶颈,同时保留因果结构。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈