标签
Hugging Face 开源了 ml-intern,一个自主智能体,能够完成整个机器学习后训练循环——阅读论文、查找数据集、编写脚本、生成数据、监控训练并上传权重——在无需人工干预的情况下,使用1.7B模型在10小时内实现了显著的GPQA提升。
Hugging Face 推出的 ml-intern 项目在 GitHub 上爆火,能够自主完成论文调研、数据处理、训练脚本编写和模型训练的全流程自动化,无需人工干预即可将小模型(如 Qwen3-1.7B)的性能大幅提升,甚至超越 Claude Code。
使用 ml-intern 和 DeepSeek V4 Flash 训练了一个提示注入分类器,使用 DistilBERT 实现 F1 99%,优化至 ONNX int8(约 65 MB),可通过 Transformers.js v3 在浏览器中运行。
Hugging Face 开源了 ml-intern,这是一个自主代理,能够阅读 ML 论文、发现数据集、训练模型、调试失败、并将生产就绪的模型上传到 Hub,自动化整个后训练工作流程。
开发者盛赞 ml-intern 工具,称其极大简化了模型/数据集发现、训练后迭代与数据处理流程。