@CaptainInsightX: OpenAI花费数十亿美元建设训练基础设施。一对澳大利亚兄弟仅用50万美元就让AI训练速度提升30倍~ M…
摘要
丹尼尔·韩和迈克尔·韩兄弟开发了Unsloth,这是一款开源工具,可将LLM微调速度提升2-30倍,内存减少70-90%,仅筹集了50万美元,却与价值数十亿美元的基础设施竞争。
查看缓存全文
缓存时间: 2026/05/16 13:19
OpenAI 花费数十亿构建训练基础设施。 两位澳洲兄弟用总计 50 万美元让 AI 训练提速 30 倍。
认识 Daniel 和 Michael Han
来自澳大利亚悉尼的兄弟 Daniel 曾是 NVIDIA 的工程师 将 t-SNE 算法加速 2000 倍,将 SVD 内存占用减半 发现并修复了 Meta 的 Llama、Google 的 Gemma、Mistral 和 Phi 中的 20 多个 Bug 大 AI 实验室在自己模型中遗漏的 Bug,他抓了出来 2023 年 12 月与哥哥 Michael 共同创办 Unsloth 构建的工具使大模型微调速度提升 2-30 倍,内存减少 70-90% 100% 开源发布,人人免费可用 GitHub 上 64,000+ 星标 每月 1000 万次模型下载 NASA 和 Canva 都在使用他们的代码 种子轮仅融资 50 万美元 入选 Y Combinator S24 批次 由兄弟二人带领一支 8 人小团队编写代码
当大实验室烧掉数十亿时,他们让 AI 变得人人触手可及。
绝对的传奇
相似文章
@h100envy: Daniel Han 创建了 Unsloth,这正是半数开源项目能在单张 GPU 而非集群上微调模型的原因。他还……
Daniel Han 构建了 Unsloth,该工具通过重写 GPU 内核,使单张 GPU 的微调速度提升 2 到 3 倍,让众多开源用户无需集群即可训练模型。
@AI_jacksaku: GitHub本周黑马:Unsloth AI模型训练速度提升2-5倍, 显存占用减少80%。 这意味着什么? 以前微调一个大模型, 需要A100集群+几万美金。 现在一张4090, 几小时就能搞定。 Unsloth做了什么? 优化了注意力机…
Unsloth开源工具将大模型微调速度提升2-5倍、显存降低80%,使单张RTX 4090几小时完成原本需A100集群的任务。
使用 Unsloth 和 Hugging Face Jobs 免费训练 AI 模型
Hugging Face 和 Unsloth 提供免费额度和训练资源,让开发者可以通过 Hugging Face Jobs 微调 AI 模型。开发者可以训练小型语言模型(如 LFM2.5-1.2B-Instruct),实现 2 倍更快的训练速度和 60% 更低的 VRAM 占用,并可配合 Claude Code 和 Codex 等编程代理使用。
@garrytan:一个6人团队正在构建任务特定AI模型,比OpenAI或Anthropic的任何模型快4到8倍。50万次下…
一个6人团队构建了任务特定AI模型,速度比OpenAI或Anthropic的模型快4到8倍,在HuggingFace上获得50万次下载。
AI 和计算
OpenAI 发布分析表明,自 2012 年以来,最大规模 AI 训练运行所使用的计算量以 3.4 个月的倍增周期呈指数级增长,累计增长 30 万倍,远远超过摩尔定律的增长速度。该分析预测这一趋势可能会继续,并呼吁增加学术 AI 研究经费以应对不断上升的计算成本。