autoregressive-models

标签

Cards List
#autoregressive-models

MGI: Member vs Generated Inference

arXiv cs.LG · 5天前 缓存

介绍了 Member vs Generated Inference (MGI) 任务,用于区分生成模型中的训练成员与生成输出,并提出了 Data Circuit Breaker (DCB),一种结合自编码器和潜在生成器信号的三阶段方法,在自回归和扩散模型中均优于现有方法。

0 人收藏 0 人点赞
#autoregressive-models

@rohanpaul_ai: atomic[.]chat 分享了一次揭示性的对比,展示了在自有硬件上运行本地开源权重LLM的情况。他们测试了…

X AI KOLs Following · 2026-06-12 缓存

在单个H100(FP8)上对本地开源权重LLM进行的基准测试比较显示,DiffusionGemma速度提升4倍,但错误数量比Gemma4 26B A4B多6倍,突显了扩散模型与自回归模型在速度和准确性之间的权衡。

0 人收藏 0 人点赞
#autoregressive-models

通过在线策略蒸馏实现数据高效的自回归到扩散语言模型

arXiv cs.CL · 2026-06-08 缓存

本文介绍了OPDLM,一种通过在线策略蒸馏将自回归语言模型转换为扩散语言模型的方法,所需训练令牌数量减少15倍到7000倍,同时保留原始模型的知识。

0 人收藏 0 人点赞
#autoregressive-models

通过轻量级结构引导的自回归模型实现新型图生成的可扩展性

arXiv cs.LG · 2026-06-04

研究人员提出了一种用于图生成的轻量级自回归框架,该框架使用结构引导的拓扑排序实现了接近对数线性的复杂度,解决了现有扩散和自回归方法在可扩展性和新颖性方面的局限性。该方法同时支持LSTM和Mamba风格的主干网络,在分子和非分子基准测试中展示了改进的新颖性,同时保持了有效性和独特性。

0 人收藏 0 人点赞
#autoregressive-models

当自回归一致性损害安全对齐时

arXiv cs.LG · 2026-06-04 缓存

本文分析了大型语言模型安全对齐为何脆弱,将其归因于“自回归一致性”——即下一个词元预测倾向于扩展当前响应轨迹——这导致对齐更新集中在早期词元上。作者提出了一种利用这一特性的“随机插入攻击”,并设计了一个对抗性安全对齐框架来应对。

0 人收藏 0 人点赞
#autoregressive-models

(HB-ARFM) 历史引导的逆向沸腾重构流匹配方法

arXiv cs.LG · 2026-06-02 缓存

本文提出了一种历史引导的自回归流匹配方法,用于从沸腾动力学部分观测中重构完整的时空场(速度和温度),解决了非马尔可夫后验下的不适定逆问题。

0 人收藏 0 人点赞
#autoregressive-models

LongLive-RAG:一种通用的检索增强长视频生成框架

Hugging Face Daily Papers · 2026-06-01 缓存

LongLive-RAG将长视频生成形式化为检索增强生成问题,利用先前生成潜变量的动态记忆来减少误差积累和身份漂移,在多种自回归骨干网络上提升了生成质量。

0 人收藏 0 人点赞
#autoregressive-models

TUBE: 离散扩散语言模型证据的切线上界

arXiv cs.LG · 2026-05-26 缓存

介绍TUBE,一种用于离散扩散语言模型的对数似然变分上界,实现更好的评估,并揭示掩码扩散模型仍不如自回归模型。

0 人收藏 0 人点赞
#autoregressive-models

归因合同:生成式语言模型中的特征归因

arXiv cs.LG · 2026-05-25 缓存

本文介绍了归因合同(Attribution Contract),这是生成式语言模型中特征归因声明的一种规范,解决了特征定义不清以及归因方法评估方式模糊的问题。论文以自回归模型和扩散模型为例,展示了归因何时具有信息量,何时可能产生误导。

0 人收藏 0 人点赞
#autoregressive-models

@TheTuringPost: 为什么 KV cache 是 LLM 速度快的主要原因之一?KV cache 将注意力机制与生成阶段连接起来……

X AI KOLs Timeline · 2026-05-25 缓存

KV cache 在自回归生成过程中存储先前计算的键向量和值向量,使模型能够避免在每一步重新计算整个序列,从而显著加速推理,但代价是内存使用增加。

0 人收藏 0 人点赞
#autoregressive-models

Q-ARVD:量化自回归视频扩散模型

Hugging Face Daily Papers · 2026-05-20 缓存

Q-ARVD是一种新颖的量化框架,通过解决帧级量化敏感度失衡和权重异常值模式,降低自回归视频扩散模型的推理成本。

0 人收藏 0 人点赞
#autoregressive-models

@DivyanshT91162: 自回归大语言模型可能正在被取代 有人构建了dLLM——一个开源库,可以将任何自…

X AI KOLs Timeline · 2026-05-16 缓存

dLLM是一个开源库,可将任何自回归大语言模型转换为扩散大语言模型,实现并行解码和更快的文本生成。

0 人收藏 0 人点赞
#autoregressive-models

@DailyDoseOfDS_: 将任意自回归LLM转换为扩散LM。dLLM是一个Python库,统一了扩散语言模型的训练与评估…

X AI KOLs Timeline · 2026-05-16 缓存

dLLM是一个开源Python库,能以极少的计算资源将任意自回归语言模型转换为扩散语言模型,统一训练和评估。

0 人收藏 0 人点赞
#autoregressive-models

KVPO:基于ODE的原生GRPO框架通过KV语义探索实现自回归视频对齐

Hugging Face Daily Papers · 2026-05-14 缓存

KVPO提出了一种基于ODE的原生在线GRPO框架,通过因果语义KV缓存探索和速度场替代策略,将流式自回归视频生成器与人类偏好对齐,在视觉质量和对齐度上实现了持续改进。

0 人收藏 0 人点赞
#autoregressive-models

出于必要性的偏差:收敛式人工智能与人类验证中顺序处理的不可能性定理

arXiv cs.AI · 2026-05-12 缓存

本文证明了不可能性定理,表明由于因果掩码(causal masking)约束,首要效应(primacy effects)、锚定效应(anchoring)和顺序依赖性(order-dependence)是自回归语言模型中架构上必然存在的偏差。作者跨越12种前沿大语言模型验证了这些理论界限,并通过涉及工作记忆负荷的预注册人类实验证实了相关预测。

0 人收藏 0 人点赞
#autoregressive-models

CausalCine:用于多镜头视频叙事的实时自回归生成

Hugging Face Daily Papers · 2026-05-12 缓存

CausalCine 是一个新的学术框架,用于实时交互式多镜头视频生成,它利用因果建模和动态内存路由技术,提高了自回归模型在镜头间的一致性。

0 人收藏 0 人点赞
#autoregressive-models

STARFlow2:连接语言模型与归一化流以实现统一的多模态生成

Hugging Face Daily Papers · 2026-05-08 缓存

STARFlow2 是一项新的研究论文,介绍了一种将语言模型与自回归归一化流相结合的架构,用于统一的多模态生成。它通过使用共享的因果掩码机制处理交错的文本-图像序列,解决了现有系统中的结构不匹配问题。

0 人收藏 0 人点赞
#autoregressive-models

何时思考,何时表达:学习大型语言模型推理中的披露策略

Hugging Face Daily Papers · 2026-05-06 缓存

本文提出了“并行交错推理(Side-by-Side Interleaved Reasoning)”方法,通过控制自回归模型中的信息揭示时机,以提高准确性和效率。实验表明,在使用 Qwen3 模型的基准测试中,通过将私密推理与部分信息披露相结合,模型性能得到了提升。

0 人收藏 0 人点赞
#autoregressive-models

自回归视频生成的投机解码

Hugging Face Daily Papers · 2026-04-19 缓存

SDVG 将投机解码引入自回归视频扩散,通过图像质量路由器在 MovieGenVideoBench 上实现最高 2.09× 加速,同时保留 95.7% 质量。

0 人收藏 0 人点赞
#autoregressive-models

(1D) 有序词元实现高效测试时搜索

Hugging Face Daily Papers · 2026-04-16 缓存

# 论文页面 - (1D) 有序词元实现高效测试时搜索 来源:[https://huggingface.co/papers/2604.15453](https://huggingface.co/papers/2604.15453) ## 摘要 具有“粗到细”词元结构的自回归模型在测试时扩展上表现更佳,并在与图文验证器结合后,实现无需训练的文本到图像生成。 [词元化](https://huggingface.co/papers?q=Tokenization) 是自回归(AR)生成模型的关键组件,将原始

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈