@TheAhmadOsman: 性能媲美Opus 4.5的3B模型VibeThinker 3B（基于Qwen 2.5）

X AI KOLs Following 2026/06/16 10:11 模型

3b-model vibethinker qwen-2-5 local-ai open-source claude-opus

摘要

Ahmad Osman宣布了VibeThinker 3B，这是一个基于Qwen 2.5的30亿参数模型，声称性能可与Claude Opus 4.5媲美，并预测可在消费级硬件上进行本地部署。

3B模型，性能媲美Opus 4.5 VibeThinker 3B（基于Qwen 2.5）https://t.co/pQIr2bC8IR

查看原文

查看缓存全文

缓存时间: 2026/06/16 11:39

3B模型，性能堪比Opus 4.5

VibeThinker 3B（基于Qwen 2.5）https://t.co/pQIr2bC8IR

Ahmad（@TheAhmadOsman）： 预测

今年年底前，我们将能在本地一台RTX PRO 6000上运行具备Claude Code + Opus 4.5品质（非阉割版）的模型。

相似文章

X AI KOLs Timeline

本技术报告介绍了VibeThinker-3B，一个3B参数的模型，通过对Qwen2.5-Coder进行训练后优化（包括基于课程的有监督微调、多域强化学习和离线自蒸馏），实现了前沿水平的可验证推理性能，达到或超越了DeepSeek V3.2等更大的模型。

Reddit r/LocalLLaMA

作者对小型本地 LLM 进行了基准测试，重点突出了 Qwen 3.6 35B A3B，其将学术代码与研究论文进行映射的能力优于 Gemma 4 和 Nemotron 3 Nano 等模型。

Hugging Face Models Trending

VibeThinker-3B 是一个拥有 3B 参数的模型，通过优化 Spectrum-to-Signal Principle (SSP) 后训练流程，在数学、编程和 STEM 基准测试上实现了前沿水平的推理性能，达到了与更大模型相当的性能。

Hugging Face Daily Papers

Qwen3.5-Omni 是一个千亿参数的多模态模型，具备先进的音视频理解与生成能力，引入了新颖的 Audio-Visual Vibe Coding，在215项基准测试中取得SOTA结果，同时与 Gemini-3.1 Pro 持平。

Reddit r/LocalLLaMA

一位用户报告称，通过Qwen 3.6 35B在本地运行'Browser OS'实现，取得了令人印象深刻的结果，凸显了该模型在不依赖云端的情况下执行复杂任务的能力。