@TeksEdge:激动人心的消息!VibeThinkiner-3B来了!好的,localmaxxers准备好测试吧!!为什么?因为3B模型的推理宣称达到了SOTA级别…
摘要
微博AI发布了VibeThinker-3B,一个拥有30亿参数的开源推理模型,采用MIT许可证,在数学、编程和STEM推理基准测试上取得了有竞争力的结果。
查看缓存全文
缓存时间: 2026/06/17 15:57
激动人心的消息!VibeThinkiner-3B 来了!本地化爱好者们,准备好测试吧!为什么?因为它的推理能力在 3B 模型中达到了 SOTA 水平,可以在许多配备中等独立显卡的电脑上运行。
来自微博 AI 的 3B 推理模型 在数学、编程和 STEM 推理方面表现出色 MIT 许可(完全开源) 现已上线 Hugging Face:WeiboAI/VibeThinker-3B
声称在可验证的推理基准测试中,能与更大的模型一较高下。
ModelScope (@ModelScope2022): 认识一下 VibeThinker-3B,这是微博 AI 推出的 3B 推理模型,专注于数学、编程和 STEM 推理。采用 MIT 许可。🚀
在 3B 参数规模下,它在 IMO-AnswerBench 上达到了与 DeepSeek V3.2 (671B)、Kimi K2.5 (1T) 和 GLM-5 (744B) 等模型相当的水平。在未见过的 LeetCode 题目上实现了 96.1% 的通过率。
相似文章
@aijoey: WeiboAI 发布了 VibeThinker-3B,所以我必须在本地尝试一下。这是一个 3B 模型,不是大型前沿系统。在视频中…
WeiboAI 发布了 VibeThinker-3B,一个在本地测试编码任务的小型 3B 推理模型,在算法问题上取得了 3/3 的成绩。
WeiboAI/VibeThinker-3B
VibeThinker-3B 是一个拥有 3B 参数的模型,通过优化 Spectrum-to-Signal Principle (SSP) 后训练流程,在数学、编程和 STEM 基准测试上实现了前沿水平的推理性能,达到了与更大模型相当的性能。
将原先的VibeThinker-1.5B扩展到3B——现已达到前沿数学与编程性能
VibeThinker-3B模型在数学和编程推理性能上达到了最先进水平,在AIME'26上得分为94.3,在未见过的LeetCode问题上正确率为96.1%,表明小模型在可验证领域可以达到前沿推理水平。
@kimmonismus: 太疯狂了:一个3B模型现在在可验证推理任务上取得了极具竞争力的结果。VibeThinker-3B得分94.3……
一个3B模型VibeThinker-3B通过在Qwen2.5-Coder上进行后训练优化,包括课程SFT、多领域RL、离线自我蒸馏以及最终的基于RL的指令阶段,在可验证推理任务上取得了极具竞争力的结果。
VibeThinker-3B:探索小型语言模型中可验证推理的前沿
VibeThinker-3B是一款紧凑型3B参数量模型,通过专门的训练流程在可验证推理任务上实现了前沿水平的性能,与DeepSeek V3.2和Gemini 3 Pro等更大模型相当。