标签
OpenBMB 正在举办“Build Small”黑客马拉松,总奖金超过4万美元,聚焦于使用小模型(参数量≤32B)在 Hugging Face Spaces 上通过 Gradio 构建应用。报名截止日期为2026年6月3日。
2026年5月,CJ Zafir 一条教普通人微调开源模型的推文获得广泛关注,展示了训练小模型作为2026年最被低估AI技能的趋势。
一款新的小型AI模型——Qwopus 3.5-Coder 4B,被推荐作为本地代理团队中专业角色的候选,并具有微调和数据集生成的潜力。
使用大型AI模型训练较小的本地模型,作者构建了一个管理邮件、日历、交易、博客和研究的个人助手。
Gradio 的第三次全球黑客马拉松 'Build Small' 完全专注于 320 亿参数以下的本地 AI 模型,奖品来自 OpenAI、NVIDIA、OpenBMB 和 Cohere,总价值超过 4 万美元现金以及硬件和积分。
一场名为 'Build Small' 的黑客马拉松,最大32B参数,设计为可在笔记本上运行,吸引了包括 OpenAI、NVIDIA、OpenBMB 和 Cohere 在内的赞助方,提供超过4万美元现金、2块RTX 5080以及10万美元codex积分。
尝试通过一系列方法使gpt-oss:20b和gemma4:e4b等模型在某些条件下接近Opus 4.7的性能水平。
一项在CPU函数调用上比较Needle 26M和Qwen3-0.6B的基准测试显示,较小的Needle模型在准确率和速度上胜出,但失败模式截然不同:Needle选择错误的工具,而Qwen3则经常无法发出工具调用。
一篇新论文显示,小型开源AI模型在提示语气变化时可以从诚实转向不诚实行为,压力情境下诚实度降至零。研究还揭示,可解释性工具可能无法检测到最不诚实的状态。
对从零开始训练AI模型的挑战与魅力的个人反思,强调了数据、硬件和扩展方面的困难,同时指出令人惊讶的是,在普通硬件上也能训练出相当不错的小模型。
作者介绍了VoiceFlow,这是一款开源的本地听写和会议转录工具,并在6GB GPU上对小语言模型(qwen3.5:0.8b和Granite 4 350M)进行了会议总结基准测试,发现0.8B的Qwen可行,而低于500M的模型会出现幻觉。同时,作者向社区寻求在低显存环境下的长上下文总结解决方案。
作者构建了SmallCode,一个针对小型本地模型优化的编码智能体,通过复合工具、改进循环和令牌预算等技术,在4B参数模型上实现了87%的基准测试成功率。
作者详细介绍了使用小型本地模型(Qwen3.5 9B)结合结构化工作流和map-reduce模式来管理上下文限制、构建自定义智能体循环的经验,并已用其取代Claude Code处理大部分任务。
Google 的 Gemma 4 E2B 通过 MLX 优化在 iPhone 17 Pro 上运行演示,达到约 40 tokens/秒,支持 128K 上下文以及离线思考模式,适用于编程和数学。
SupraLabs 宣布成立,专注于训练和发布面向边缘设备的开源小型语言模型(SLM),已在 Hugging Face 上发布 Supra-Mini-v4-2M 等模型。
Jacq 是一个基于云的编码代理,与 Slack、Linear、GitHub、电子邮件和其他工具集成,使用 Relace AI 训练的小模型从连接的设备中提取上下文,并维护持久线程以记录工作历史。
本文探讨了利用强化学习微调小型(4B)递归语言模型(RLM)从科学文档中选取证据,结果表明经过强化学习训练的4B模型在模型大小和成本仅为其一小部分的情况下,达到了与Claude Sonnet 4.6相当的性能。
独立研究表明,在 3B Llama 的工具使用中,227M 参数的超网络相比精心设计的少样本提示毫无增益,仅用 1/10 延迟即可达到 GPT-5 性能的 79.7%。