depth-compression

标签

Cards List
#depth-compression

CHERRY:压缩层次化专家与循环表示收益

arXiv cs.CL · 4天前 缓存

本文介绍CHERRY,一套用于计算高效语言模型的技术,包括选择性令牌监督、通过循环展开的深度压缩以及混合压缩专家,在韩语基础模型上取得了显著的效率提升。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈