tiny-model

标签

Cards List
#tiny-model

从零开始在8GB显存上训练LLM。我开心

Reddit r/LocalLLaMA · 5天前

构建了一个仓库,用于在8GB显存上从零训练一个微型语言模型(25M参数),支持MTP,但指出mHC和BitNet的局限性。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈