Qwen 3.6 27B 太牛了
摘要
一位用户分享了在本地使用 Qwen 3.6 27B 进行复杂研究和编程的积极体验,发现它在职业建议和移民研究方面优于 Gemini Pro,同时也提到 Gemma 4 31B 存在性能问题。
这更多是一篇对在本地运行的 Qwen 3.6 27B(8 位 unsloth 量化)的快速赞赏帖。我主要是在 OpenCode 中将其与我的 35B 模型一起用于规划和编码。我也曾在 Open WebUI 中设置过它,但在大约两周前 llama.cpp 加入 MTP 支持之前,OWUI 上的 TPS 慢得令人痛苦,基本上无法用于聊天。自那以后,我将它们配对,并将 Qwen 27B 作为日常聊天助手与 Gemini Pro 一起使用。我一直在心里对两者进行持续比较。对于简单的问题,Gemini 处理得还不错。但上周末我深入研究了职业建议和公司投资组合,以及一些移民研究。Gemini 在这方面完全崩溃了。它开始产生幻觉,并根据对话中的早期消息和我之前的聊天记录执着于某些内容。我认为这种退化在过去几周左右开始出现,想知道其他人最近对 Gemini 的体验。我最终自己做了大量手动研究。然后我决定用 Qwen 3.6 27B 尝试同样的研究。我真的很惊讶它在职业/公司相关内容和移民研究方面表现要好得多。移民结果尤为突出,因为它实际上需要查阅官方文档并理解其含义,而不是简单地重复某些内容。另外,我也尝试了 Gemma 4 31B,听说它非常适合研究和规划,但在我的 M5 Max 128GB 上以 8 位量化运行时速度太慢。想知道大家对此的看法,也许一旦 MTP 支持启用,我会再试试它。
相似文章
Qwen 35b a3b 令我惊喜
用户报告了使用 Qwen 35b a3b 进行代理编码任务的积极体验,指出在其使用场景中它优于 Gemma4 26b,并且在演示/数据分析方面表现出色,尤其是在代理模式而非聊天模式下。
Qwen 3.6 35B A3B 的热度绝非虚名!
作者对小型本地 LLM 进行了基准测试,重点突出了 Qwen 3.6 35B A3B,其将学术代码与研究论文进行映射的能力优于 Gemma 4 和 Nemotron 3 Nano 等模型。
gemma-4-12b-it vs Qwen3.5-9B 在共同基准测试中的对比:Qwen 在 5/8 项基准测试中击败 gemma,虽体积更小但总体胜出
Qwen3.5-9B 在 8 项基准测试中的 5 项中优于 gemma-4-12b-it,尽管模型体积更小。gemma 仅在编程能力上略胜一筹。
有人用 QwQ-32B 吗?它已经发布超过一年了?Qwen 3.6 27b 基本上取代它了吗?
讨论老款 QwQ-32B 模型相较于 Qwen 3.6 27b 和 Gemma 4 等新替代品是否仍有价值,尤其是在编程任务方面。
Qwen 3.6 35B A3B 与 Qwen 3.5 122B A10B 对比
用户反馈,尽管基准测试表现亮眼,Qwen 3.5 122B 在多步任务上大幅领先 Qwen 3.6 35B,怀疑是量化或部署配置问题。