small-language-model

#small-language-model

[新模型] SupraLabs 刚刚发布了 supra-title-FFT-preview，115K 样本，几乎是我们的首个聊天标题数据集的10倍

Reddit r/LocalLLaMA ↗ · 4天前

SupraLabs 发布了 supra-title-FFT-preview，一个完全微调的0.4B参数模型，用于聊天标题生成，在115K样本上训练——比之前的数据集大了近10倍。

0 人收藏 0 人点赞

#small-language-model

@xdotli: 我的朋友 @xeophon 认为编码问题已经解决了，这里有一个验证：一个3B模型接受了以算法效率为重点的训练……

X AI KOLs Timeline ↗ · 4天前缓存

Nanbeige 4.1，一个3B模型，在编码任务中专注于算法效率，超越了Qwen3-30b-A3b和Qwen 3.5 4b，实现了600多次工具调用的长时任务。

0 人收藏 0 人点赞

#small-language-model

@cjzafir: 一个3B参数的小语言模型：VibeThinker（基于Qwen 2.5微调）性能媲美Claude Opus 4.5。性能与以下模型相当： > De…

X AI KOLs Timeline ↗ · 6天前缓存

VibeThinker是一个3B参数的模型，基于Qwen 2.5微调，通过创新的后训练方法（包括多路径思维和在数学、编程、科学上的分阶段训练），实现了与Claude Opus 4.5以及更大的模型（如DeepSeek v3）相当的性能。

0 人收藏 0 人点赞

#small-language-model

微软测试Phi Silica在Nvidia GPU上用于Windows AI（6分钟阅读）

TLDR AI ↗ · 2026-06-17 缓存

微软正在测试Phi Silica在Nvidia GPU上的支持，允许开发者在配备RTX 30系列或更新GPU的Windows设备上本地运行这一小型语言模型，不过缺少仅限NPU的功能，比如提示压缩。

0 人收藏 0 人点赞

#small-language-model

为什么微博的迷你VibeThinker-3B再次引发AI界关于基准测试的争论（15分钟阅读）

TLDR AI ↗ · 2026-06-17 缓存

微博的VibeThinker-3B，一个3B参数模型，声称在数学和编程基准测试中匹配或超越DeepSeek V3.2和Gemini 3 Pro等更大模型的推理性能，引发了关于基准测试可靠性和扩展必要性的争论。

0 人收藏 0 人点赞

#small-language-model

将原先的VibeThinker-1.5B扩展到3B——现已达到前沿数学与编程性能

Reddit r/LocalLLaMA ↗ · 2026-06-16

VibeThinker-3B模型在数学和编程推理性能上达到了最先进水平，在AIME'26上得分为94.3，在未见过的LeetCode问题上正确率为96.1%，表明小模型在可验证领域可以达到前沿推理水平。

0 人收藏 0 人点赞

#small-language-model

Cleo: 尝试在2B模型中拟合完整的分析师行为 [P]

Reddit r/MachineLearning ↗ · 2026-06-15

Cleo 是 Qwen3.5-2B-Base 的微调版本，专为Text-to-SQL任务设计，使用统一的训练和推理框架，支持实时执行证据和安全检查。所有代码、模型和数据集均为开源。

0 人收藏 0 人点赞

#small-language-model

@GitTrend0x: 专攻纯本地桌面自动化神器，最重要省钱！ https://github.com/microsoft/fara 这就是 Fara-7B，微软推出的高效 Computer Use Agent 小模型！一句话干翻传统大模型 CUA：仅 7B 参数…

X AI KOLs Timeline ↗ · 2026-06-15 缓存

微软推出 Fara-7B，一款仅 7B 参数的高效 Computer Use Agent，在网页任务上超越更大模型，支持纯本地部署，低成本实现桌面自动化。

0 人收藏 0 人点赞

#small-language-model

@nini_incrypto_: 微软最近推出的走实战路线的东东，直接让 7B 模型接管你的鼠标键盘！ FARA，它抛弃了无意义的聊天，专攻纯本地桌面自动化。它的核心优势就两个词，听话、省钱： 1. 纯桌面执行：自己打开网页、填表单，自动跑完所有重复的机械流程。 2. …

X AI KOLs Timeline ↗ · 2026-06-14 缓存

微软发布了Fara-7B，一个7B参数的小型语言模型，专攻纯本地桌面自动化，能直接接管鼠标键盘执行重复流程，成本低且无需联网。

0 人收藏 0 人点赞

#small-language-model

[新模型] Supra-Title-0.3B 刚刚发布！

Reddit r/LocalLLaMA ↗ · 2026-06-12

Supra Labs 发布了 Supra Title，这是一个参数为 350M 的专用模型，用于生成聊天对话标题。该模型基于 LFM2.5 构建，以 GGUF 格式运行在任何硬件上，且无需系统提示。

0 人收藏 0 人点赞

#small-language-model

WeiboAI/VibeThinker-3B

Hugging Face Models Trending ↗ · 2026-06-12 缓存

VibeThinker-3B 是一个拥有 3B 参数的模型，通过优化 Spectrum-to-Signal Principle (SSP) 后训练流程，在数学、编程和 STEM 基准测试上实现了前沿水平的推理性能，达到了与更大模型相当的性能。

0 人收藏 0 人点赞

#small-language-model

IAPO：面向小规模多模态智能体工具使用的输入归因感知策略优化

arXiv cs.LG ↗ · 2026-06-11 缓存

本文介绍了IAPO，一种通过将输入归因与更强大的教师模型对齐，来提升多模态小语言模型工具调用能力的强化学习算法。在Qwen2.5-VL-3B上的实验表明，在六个测试集上，视觉问答准确率平均提升了3%。

0 人收藏 0 人点赞

#small-language-model

@harshbhatt7585: https://x.com/harshbhatt7585/status/2063593933314113587

X AI KOLs Timeline ↗ · 2026-06-07 缓存

作者分享了从头训练一个160M参数大语言模型的经验，尝试了多种架构，如多Token预测和分层推理模型。他强调快速迭代、简化思路以及理解架构有效原因的重要性。

0 人收藏 0 人点赞

#small-language-model

Microsoft Aion 1.0 Instruct 和 Aion 1.0 Plan 模型！

Reddit r/LocalLLaMA ↗ · 2026-06-03

微软在 Build 2026 上宣布了两款新的设备端 AI 模型：Aion 1.0 Instruct（一款开放权重的小型语言模型）和 Aion 1.0 Plan（一款 140 亿参数的推理与工具调用模型，适用于本地智能体工作流）。

0 人收藏 0 人点赞

#small-language-model

我从零开始训练了一个75M参数的LLM，使用18B tokens，它击败了几乎两倍大小的模型

Reddit r/LocalLLaMA ↗ · 2026-06-02

从零开始训练了一个名为KeyLM的75M参数LLM，使用18B tokens，在指令跟随得分上与更大模型竞争，同时使用更少的参数和更少的数据。

0 人收藏 0 人点赞

#small-language-model

OpenBMB 发布 MiniCPM5-1B 大语言模型。目前同尺寸下最强大的大语言模型之一。（在 Artificial Analysis Intelligence Index 上得分为 17.9）

Reddit r/singularity ↗ · 2026-05-27 缓存

OpenBMB 发布 MiniCPM5-1B，这是一款领先的 1B 参数开源权重大语言模型，在同尺寸类别中取得了 Artificial Analysis Intelligence Index 最高分（17.9），超越了 Qwen3.5 2B 等更大模型，而使用的参数更少。

0 人收藏 0 人点赞

#small-language-model

@AdinaYakup: MiniCPM5-1B 是 1B 参数级别中的一款令人印象深刻的发布！@OpenBMB https://huggingface.co/collections/openbmb/minicpm5… 1B …

X AI KOLs Following ↗ · 2026-05-25 缓存

MiniCPM5-1B 是 OpenBMB 推出的全新 1B 参数 AI 模型，具有 Think/No-Think 模式的混合推理能力、128K 上下文窗口、Apache 2.0 许可证，并可在多种硬件上运行。

0 人收藏 0 人点赞

#small-language-model

@ModelScope2022: MiniCPM5-1B 现已完全开源，包含权重、训练数据和部署代码。1B参数，在Artificial Analysis上排名第一…

X AI KOLs Following ↗ · 2026-05-25 缓存

MiniCPM5-1B 已完全开源，包含权重、训练数据和部署代码；它在2B以下模型中取得最高评分，并可在边缘设备上运行。

0 人收藏 0 人点赞

#small-language-model

[新发布] Supra-50M 正式推出！

Reddit r/LocalLLaMA ↗ · 2026-05-22

SupraLabs 发布了 Supra-50M，一个紧凑的 5000 万参数因果语言模型，包含基础版和指令版，基于 fineweb-edu 的 200 亿个 token 训练，在多项关键基准测试中达到了可与 GPT-2 和 SmolLM 等更大模型竞争的水平。

0 人收藏 0 人点赞

#small-language-model

@Sapient_Int: 推出 HRM-Text。一个超精简的 1B 参数推理语言模型，旨在提供强大的通用性能…

X AI KOLs Timeline ↗ · 2026-05-18 缓存

Sapient Intelligence 推出 HRM-Text，这是一个 1B 参数的推理语言模型，仅使用 40B tokens 训练，预算为 1000 美元，在大幅减少数据和计算需求的同时实现了具有竞争力的性能。

0 人收藏 0 人点赞

small-language-model

提交意见反馈