@TheAhmadOsman: 性能媲美Opus 4.5的3B模型VibeThinker 3B(基于Qwen 2.5)
摘要
Ahmad Osman宣布了VibeThinker 3B,这是一个基于Qwen 2.5的30亿参数模型,声称性能可与Claude Opus 4.5媲美,并预测可在消费级硬件上进行本地部署。
查看缓存全文
缓存时间: 2026/06/16 11:39
3B模型,性能堪比Opus 4.5
VibeThinker 3B(基于Qwen 2.5)https://t.co/pQIr2bC8IR
Ahmad(@TheAhmadOsman): 预测
今年年底前,我们将能在本地一台RTX PRO 6000上运行具备Claude Code + Opus 4.5品质(非阉割版)的模型。
相似文章
@f14bertolotti:一款3B模型的出色表现。这些成果主要通过对Qwen2.5进行训练后优化而实现……
本技术报告介绍了VibeThinker-3B,一个3B参数的模型,通过对Qwen2.5-Coder进行训练后优化(包括基于课程的有监督微调、多域强化学习和离线自蒸馏),实现了前沿水平的可验证推理性能,达到或超越了DeepSeek V3.2等更大的模型。
Qwen 3.6 35B A3B 的热度绝非虚名!
作者对小型本地 LLM 进行了基准测试,重点突出了 Qwen 3.6 35B A3B,其将学术代码与研究论文进行映射的能力优于 Gemma 4 和 Nemotron 3 Nano 等模型。
WeiboAI/VibeThinker-3B
VibeThinker-3B 是一个拥有 3B 参数的模型,通过优化 Spectrum-to-Signal Principle (SSP) 后训练流程,在数学、编程和 STEM 基准测试上实现了前沿水平的推理性能,达到了与更大模型相当的性能。
Qwen3.5-Omni 技术报告
Qwen3.5-Omni 是一个千亿参数的多模态模型,具备先进的音视频理解与生成能力,引入了新颖的 Audio-Visual Vibe Coding,在215项基准测试中取得SOTA结果,同时与 Gemini-3.1 Pro 持平。
“Browser OS”由Qwen 3.6 35B实现:这是我从本地模型获得的最佳结果
一位用户报告称,通过Qwen 3.6 35B在本地运行'Browser OS'实现,取得了令人印象深刻的结果,凸显了该模型在不依赖云端的情况下执行复杂任务的能力。