ar-to-dlm

标签

Cards List
#ar-to-dlm

通过在线策略蒸馏实现数据高效的自回归到扩散语言模型

arXiv cs.CL · 4天前 缓存

本文介绍了OPDLM,一种通过在线策略蒸馏将自回归语言模型转换为扩散语言模型的方法,所需训练令牌数量减少15倍到7000倍,同时保留原始模型的知识。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈