标签
Clement Delangue 发推文强调拥有AI模型权重的重要性,指出如果你不拥有它们,你就没有拥有你的大脑。
谷歌顶尖AI研究人员,包括Shazeer和John Jumper,正跳槽到竞争对手,表明真正的资产是人才而非模型权重。文章建议不要依赖任何单一的AI模型提供商。
关于2位量化感知训练(QAT)在更大规模MoE模型上的潜力的讨论,比较其与4位QAT及三元LLM的性能,并探讨在消费级硬件上的可行性。
Google 的 Gemma4-12B 模型权重在 HuggingFace 上已静默更新;更新原因不明,但可能涉及修复。
Meta 向 Heretic 项目发出法律通知,涉及对其 Llama AI 模型的衍生作品,促使该项目移除权重并宣布计划通过官方 Codeberg 镜像实现基础设施多样化。
Hugging Face推出Storage Buckets,这是一个专为AI团队构建的存储解决方案,提供按TB计费、内置CDN以及针对模型权重、数据集和检查点的Xet去重功能。
OpenAI 向 NTIA 提交了一份评论,概述了他们在模型权重分布方面的历史方法,从 GPT-2 的分阶段发布到 GPT-3 的 API 优先策略,同时讨论了开源模型发布与通过商业产品进行受控部署之间的权衡。