@aijoey: WeiboAI 发布了 VibeThinker-3B,所以我必须在本地尝试一下。这是一个 3B 模型,不是大型前沿系统。在视频中…
摘要
WeiboAI 发布了 VibeThinker-3B,一个在本地测试编码任务的小型 3B 推理模型,在算法问题上取得了 3/3 的成绩。
查看缓存全文
缓存时间: 2026/06/17 03:46
WeiboAI发布了VibeThinker-3B,所以我不得不在本地试一下。
这是一个3B模型,不是庞大的前沿系统。
在视频中,我在我的DGX Spark上加载它,给它3个简单的算法问题,实时流式输出模型的实际输出,然后通过pytest运行生成的Python代码。
没有基准测试截图
没有预设答案
只是一个微小的本地推理器写代码,然后由真实测试来判断是否成功。
结果是3/3。
相似文章
WeiboAI/VibeThinker-3B
VibeThinker-3B 是一个拥有 3B 参数的模型,通过优化 Spectrum-to-Signal Principle (SSP) 后训练流程,在数学、编程和 STEM 基准测试上实现了前沿水平的推理性能,达到了与更大模型相当的性能。
@TeksEdge:激动人心的消息!VibeThinkiner-3B来了!好的,localmaxxers准备好测试吧!!为什么?因为3B模型的推理宣称达到了SOTA级别…
微博AI发布了VibeThinker-3B,一个拥有30亿参数的开源推理模型,采用MIT许可证,在数学、编程和STEM推理基准测试上取得了有竞争力的结果。
为什么微博的迷你VibeThinker-3B再次引发AI界关于基准测试的争论(15分钟阅读)
微博的VibeThinker-3B,一个3B参数模型,声称在数学和编程基准测试中匹配或超越DeepSeek V3.2和Gemini 3 Pro等更大模型的推理性能,引发了关于基准测试可靠性和扩展必要性的争论。
将原先的VibeThinker-1.5B扩展到3B——现已达到前沿数学与编程性能
VibeThinker-3B模型在数学和编程推理性能上达到了最先进水平,在AIME'26上得分为94.3,在未见过的LeetCode问题上正确率为96.1%,表明小模型在可验证领域可以达到前沿推理水平。
VibeThinker-3B:探索小型语言模型中可验证推理的前沿
VibeThinker-3B是一款紧凑型3B参数量模型,通过专门的训练流程在可验证推理任务上实现了前沿水平的性能,与DeepSeek V3.2和Gemini 3 Pro等更大模型相当。