multi-block

标签

Cards List
#multi-block

多块扩散语言模型

Hugging Face Daily Papers · 3天前 缓存

本文提出多块扩散语言模型(MBD-LMs),将单块扩散扩展为并发多块解码,并采用优化训练策略如多块教师强制(Multi-block Teacher Forcing)和优化的块缓冲区解码算法。实验表明,每次前向传递的令牌数增加,基准测试准确率提升。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈