llada2.1

标签

Cards List
#llada2.1

扩散语言模型中用于Token编辑的自生成错误训练

arXiv cs.CL · 2026-06-17 缓存

提出了自生成T2T(Self-Generated T2T)训练方法,该方法通过使用模型自身的预测作为错误源,使Token编辑训练与推理对齐,从而提高了LLaDA2.1的准确性。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈