联合所有GPU来训练一个社区模型
摘要
关于从社区汇集GPU以训练大规模AI模型的讨论,质疑其可行性以及现有项目,尽管存在已知瓶颈如延迟和权重中毒。
这个子社区拥有惊人的集体显存量。为什么我们不汇集GPU来训练一个庞大的社区模型?目前是否有活跃的分布式志愿计算项目实际在做这件事?我知道瓶颈(延迟、权重中毒、节点断开),有没有人成功完成过社区训练?还是说延迟瓶颈太严重了?
相似文章
进来参与:社区模型构建讨论帖
一个帖子提出了一种通过众包计算创建社区AI模型的方法,利用Branch-Train-Stitch技术将独立训练的子模型组装成混合专家(MoE)模型,并讨论了硬件要求、参与者参与方式和技术挑战。
AI训练能否像比特币挖矿那样去中心化?[D]
本文探讨了AI训练能否像比特币挖矿那样去中心化,参与者贡献GPU资源训练开源模型以换取代币,并引发了关于验证、虚假梯度和效率等问题的讨论。
@andrewchen:体验本地AI模型的主要缺点在于你会买一块GPU,然后另一块,接着又一块……
Andrew Chen分享了他为本地AI实验购买多块GPU的经历,在5090 eGPU上以100 tok/s运行Qwen3.6 27B密集模型,并将其与Sonnet 4.6进行比较。
@leopardracer: https://x.com/leopardracer/status/2055341758523883631
一位用户分享了他们搭建双GPU本地AI实验室的经验,使用了RTX 4080 Super和5060 Ti,通过llama.cpp和llama-swap运行Qwen 3.6模型,以降低API成本并实现无限制的实验。
为什么人们不能用自己的GPU运行Gemini和Claude Code?
一篇评论文章,质疑用户为何不能在自有GPU上本地运行Gemini和Claude Code,暗示计算成本制约了对这些AI模型的访问。