model-family

标签

Cards List
#model-family

通过蒸馏和量化扩展Apertus LLM系列

arXiv cs.LG · 2026-05-29 缓存

本文验证了蒸馏和量化作为经济高效的方法,用于将Apertus LLM系列扩展到新的规模和硬件格式,生成了Apertus-v1.1模型,参数高达4B,在1.7T tokens上训练。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈