nested-subnetworks

标签

Cards List
#nested-subnetworks

FlexMoE: 面向MoE语言模型的一体通用嵌套式专家内剪枝

arXiv cs.LG · 5天前 缓存

FlexMoE提出了一种面向MoE语言模型的一体通用嵌套式专家内部剪枝方法,能够在单次训练中生成多个可部署的子网络,且性能损失极小。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈