left-to-right-verification

#left-to-right-verification

训练扩散模型进行从左到右推测

arXiv cs.CL ↗ · 2026-06-11 缓存

本文提出了三种训练时干预方法（位置加权、首次错误焦点损失和链损失），用于在推测解码中将基于扩散的草稿模型与自回归验证对齐，使接受前缀长度提升21-76%，且不增加推理开销。

0 人收藏 0 人点赞