标签
SupraLabs 发布了 supra-title-FFT-preview,一个完全微调的0.4B参数模型,用于聊天标题生成,在115K样本上训练——比之前的数据集大了近10倍。
Nanbeige 4.1,一个3B模型,在编码任务中专注于算法效率,超越了Qwen3-30b-A3b和Qwen 3.5 4b,实现了600多次工具调用的长时任务。
VibeThinker是一个3B参数的模型,基于Qwen 2.5微调,通过创新的后训练方法(包括多路径思维和在数学、编程、科学上的分阶段训练),实现了与Claude Opus 4.5以及更大的模型(如DeepSeek v3)相当的性能。
微软正在测试Phi Silica在Nvidia GPU上的支持,允许开发者在配备RTX 30系列或更新GPU的Windows设备上本地运行这一小型语言模型,不过缺少仅限NPU的功能,比如提示压缩。
微博的VibeThinker-3B,一个3B参数模型,声称在数学和编程基准测试中匹配或超越DeepSeek V3.2和Gemini 3 Pro等更大模型的推理性能,引发了关于基准测试可靠性和扩展必要性的争论。
VibeThinker-3B模型在数学和编程推理性能上达到了最先进水平,在AIME'26上得分为94.3,在未见过的LeetCode问题上正确率为96.1%,表明小模型在可验证领域可以达到前沿推理水平。
Cleo 是 Qwen3.5-2B-Base 的微调版本,专为Text-to-SQL任务设计,使用统一的训练和推理框架,支持实时执行证据和安全检查。所有代码、模型和数据集均为开源。
微软推出 Fara-7B,一款仅 7B 参数的高效 Computer Use Agent,在网页任务上超越更大模型,支持纯本地部署,低成本实现桌面自动化。
微软发布了Fara-7B,一个7B参数的小型语言模型,专攻纯本地桌面自动化,能直接接管鼠标键盘执行重复流程,成本低且无需联网。
Supra Labs 发布了 Supra Title,这是一个参数为 350M 的专用模型,用于生成聊天对话标题。该模型基于 LFM2.5 构建,以 GGUF 格式运行在任何硬件上,且无需系统提示。
VibeThinker-3B 是一个拥有 3B 参数的模型,通过优化 Spectrum-to-Signal Principle (SSP) 后训练流程,在数学、编程和 STEM 基准测试上实现了前沿水平的推理性能,达到了与更大模型相当的性能。
本文介绍了IAPO,一种通过将输入归因与更强大的教师模型对齐,来提升多模态小语言模型工具调用能力的强化学习算法。在Qwen2.5-VL-3B上的实验表明,在六个测试集上,视觉问答准确率平均提升了3%。
作者分享了从头训练一个160M参数大语言模型的经验,尝试了多种架构,如多Token预测和分层推理模型。他强调快速迭代、简化思路以及理解架构有效原因的重要性。
微软在 Build 2026 上宣布了两款新的设备端 AI 模型:Aion 1.0 Instruct(一款开放权重的小型语言模型)和 Aion 1.0 Plan(一款 140 亿参数的推理与工具调用模型,适用于本地智能体工作流)。
从零开始训练了一个名为KeyLM的75M参数LLM,使用18B tokens,在指令跟随得分上与更大模型竞争,同时使用更少的参数和更少的数据。
OpenBMB 发布 MiniCPM5-1B,这是一款领先的 1B 参数开源权重大语言模型,在同尺寸类别中取得了 Artificial Analysis Intelligence Index 最高分(17.9),超越了 Qwen3.5 2B 等更大模型,而使用的参数更少。
MiniCPM5-1B 是 OpenBMB 推出的全新 1B 参数 AI 模型,具有 Think/No-Think 模式的混合推理能力、128K 上下文窗口、Apache 2.0 许可证,并可在多种硬件上运行。
MiniCPM5-1B 已完全开源,包含权重、训练数据和部署代码;它在2B以下模型中取得最高评分,并可在边缘设备上运行。
SupraLabs 发布了 Supra-50M,一个紧凑的 5000 万参数因果语言模型,包含基础版和指令版,基于 fineweb-edu 的 200 亿个 token 训练,在多项关键基准测试中达到了可与 GPT-2 和 SmolLM 等更大模型竞争的水平。
Sapient Intelligence 推出 HRM-Text,这是一个 1B 参数的推理语言模型,仅使用 40B tokens 训练,预算为 1000 美元,在大幅减少数据和计算需求的同时实现了具有竞争力的性能。