@aijoey: WeiboAI 发布了 VibeThinker-3B，所以我必须在本地尝试一下。这是一个 3B 模型，不是大型前沿系统。在视频中…

X AI KOLs Timeline 2026/06/16 21:51 模型

small-model local-inference coding open-source reasoning-model python 3b

摘要

WeiboAI 发布了 VibeThinker-3B，一个在本地测试编码任务的小型 3B 推理模型，在算法问题上取得了 3/3 的成绩。

WeiboAI 发布了 VibeThinker-3B，所以我必须在本地尝试一下。这是一个 3B 模型，不是大型前沿系统。在视频中，我将其加载到我的 DGX Spark 上，给了它 3 个小算法问题，实时流式传输实际模型输出，然后通过 pytest 运行生成的 Python 代码。没有基准测试截图没有预先准备好的答案只是一个本地小型推理器编写代码，并通过真实测试判断其是否有效结果 3/3。

查看原文

查看缓存全文

缓存时间: 2026/06/17 03:46

WeiboAI发布了VibeThinker-3B，所以我不得不在本地试一下。

这是一个3B模型，不是庞大的前沿系统。

在视频中，我在我的DGX Spark上加载它，给它3个简单的算法问题，实时流式输出模型的实际输出，然后通过pytest运行生成的Python代码。

没有基准测试截图
没有预设答案
只是一个微小的本地推理器写代码，然后由真实测试来判断是否成功。

结果是3/3。

相似文章

WeiboAI/VibeThinker-3B

Hugging Face Models Trending

VibeThinker-3B 是一个拥有 3B 参数的模型，通过优化 Spectrum-to-Signal Principle (SSP) 后训练流程，在数学、编程和 STEM 基准测试上实现了前沿水平的推理性能，达到了与更大模型相当的性能。

@TeksEdge：激动人心的消息！VibeThinkiner-3B来了！好的，localmaxxers准备好测试吧！！为什么？因为3B模型的推理宣称达到了SOTA级别…

X AI KOLs Following

微博AI发布了VibeThinker-3B，一个拥有30亿参数的开源推理模型，采用MIT许可证，在数学、编程和STEM推理基准测试上取得了有竞争力的结果。

为什么微博的迷你VibeThinker-3B再次引发AI界关于基准测试的争论（15分钟阅读）

TLDR AI

微博的VibeThinker-3B，一个3B参数模型，声称在数学和编程基准测试中匹配或超越DeepSeek V3.2和Gemini 3 Pro等更大模型的推理性能，引发了关于基准测试可靠性和扩展必要性的争论。

将原先的VibeThinker-1.5B扩展到3B——现已达到前沿数学与编程性能

Reddit r/LocalLLaMA

VibeThinker-3B模型在数学和编程推理性能上达到了最先进水平，在AIME'26上得分为94.3，在未见过的LeetCode问题上正确率为96.1%，表明小模型在可验证领域可以达到前沿推理水平。

VibeThinker-3B：探索小型语言模型中可验证推理的前沿

Hugging Face Daily Papers

VibeThinker-3B是一款紧凑型3B参数量模型，通过专门的训练流程在可验证推理任务上实现了前沿水平的性能，与DeepSeek V3.2和Gemini 3 Pro等更大模型相当。