llada2.1

#llada2.1

扩散语言模型中用于Token编辑的自生成错误训练

arXiv cs.CL ↗ · 2026-06-17 缓存

提出了自生成T2T（Self-Generated T2T）训练方法，该方法通过使用模型自身的预测作为错误源，使Token编辑训练与推理对齐，从而提高了LLaDA2.1的准确性。

0 人收藏 0 人点赞