scratch-pretrained

标签

Cards List
#scratch-pretrained

Sumi:从头训练的开放均匀扩散语言模型

Hugging Face Daily Papers · 2026-06-17 缓存

Sumi 是一个 7B 参数的均匀扩散语言模型,在 1.5T token 上从头预训练,在知识和推理任务上取得了有竞争力的性能,同时完全开源,发布了模型权重和训练方案。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈