left-to-right-verification

标签

Cards List
#left-to-right-verification

训练扩散模型进行从左到右推测

arXiv cs.CL · 2026-06-11 缓存

本文提出了三种训练时干预方法(位置加权、首次错误焦点损失和链损失),用于在推测解码中将基于扩散的草稿模型与自回归验证对齐,使接受前缀长度提升21-76%,且不增加推理开销。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈