[成立] SupraLabs - 为你带来真正开源的人工智能模型!
摘要
SupraLabs 宣布成立,专注于训练和发布面向边缘设备的开源小型语言模型(SLM),已在 Hugging Face 上发布 Supra-Mini-v4-2M 等模型。
https://preview.redd.it/k6lub2ypva1h1.png?width=1500&format=png&auto=webp&s=cd44452c86b5216fec17113a72f43bbf169edafb 嘿 r/LocalLLaMA!我们成立了 **SupraLabs**,这真是太棒了!
# 我们做什么?
我们训练、微调并探索小模型,取得良好成果,旨在通过让每个人都能使用来革新小型 AI 模型。❤️🙂
# 我们在 Hugging Face 上吗?
当然:[https://huggingface.co/SupraLabs](https://huggingface.co/SupraLabs)
# 已经有模型了吗?
是的,已经有模型了!例如:[https://huggingface.co/SupraLabs/Supra-Mini-v4-2M](https://huggingface.co/SupraLabs/Supra-Mini-v4-2M) 以及更多!
# 接下来会有什么模型?
我们很快会分享更多模型,比如:
* StorySupra 10M:一个 10M 的故事讲述 SLM,可在边缘设备上运行
* Supra Mini **v5** 5M:一个前沿的 SLM,性能出色,效果卓越
* 更多……敬请期待
# 我在哪里获取更新?
你可以在我们的博客中阅读:[https://huggingface.co/spaces/SupraLabs/Blog](https://huggingface.co/spaces/SupraLabs/Blog) 欢迎查看!
# 我可以加入或支持吗?
可以!如果你想加入我们,欢迎在 HF 的社区讨论中或在此帖子下评论提问!此外,你还可以通过下载、点赞我们的模型以及在 HF 上关注我们来支持我们。查看所有模型:[https://huggingface.co/SupraLabs/models](https://huggingface.co/SupraLabs/models)
相似文章
[新发布] Supra-50M 正式推出!
SupraLabs 发布了 Supra-50M,一个紧凑的 5000 万参数因果语言模型,包含基础版和指令版,基于 fineweb-edu 的 200 亿个 token 训练,在多项关键基准测试中达到了可与 GPT-2 和 SmolLM 等更大模型竞争的水平。
[新模型] SupraLabs 推出了 Any2Any 模型系列!
SupraLabs 发布了 Supra-A2A-Nano-Exp,这是一个小型任意到任意自回归模型,将文本和图像标记化统一到单个 Transformer 中,作为教育原型而非生产就绪系统。
从零开始开发开源大语言模型:从预训练到RLHF(PPO/GRPO)
一位开发者分享了从零开始训练一个70亿参数开源大语言模型的进展,该模型基于DeepSeek架构并针对低显存进行了优化,目标是推动AI开发的民主化,并最终超越大型专有模型。
使用 Unsloth 和 Hugging Face Jobs 免费训练 AI 模型
Hugging Face 和 Unsloth 提供免费额度和训练资源,让开发者可以通过 Hugging Face Jobs 微调 AI 模型。开发者可以训练小型语言模型(如 LFM2.5-1.2B-Instruct),实现 2 倍更快的训练速度和 60% 更低的 VRAM 占用,并可配合 Claude Code 和 Codex 等编程代理使用。
@dhruvtwt_:怎么没人聊这事?@nvidia 正免费提供约 80 款 AI 模型的托管 API
Nvidia 低调开放约 80 款免费托管 AI 模型 API,包括 MiniMax M2.7、GLM 5.1、Kimi 2.5、DeepSeek 3.2、GPT-OSS-120B 等,可直接接入 OpenClaude、Zed IDE 等主流开发工具。