引用 Georgi Gerganov
摘要
Georgi Gerganov 证实 Qwen3.6-27B 是一个非常强大的本地编程模型,他日常在 M2 Ultra 或 RTX 5090 上使用一个轻量级框架来运行它。
暂无内容
查看缓存全文
缓存时间: 2026/06/16 19:33
# Georgi Gerganov 的一段引述
来源:https://simonwillison.net/2026/Jun/16/georgi-gerganov/
2026年6月16日
> 我可以 100% 确认,Qwen3.6-27B 是一个非常强大的本地编码模型。过去一个半月里,我几乎每天都在使用它,无论是在我的 M2 Ultra 还是 RTX 5090 机器上。我用它来处理 ggml-org 的一些小型日常任务(https://github.com/search?q=%22Assisted-by%22+user%3Aggml-org&type=commits&ref=advsearch)——确实没什么惊人之举,但对维护者来说绝对是一个有用的工具。如果我不需要花大量时间审核 Pull Request,我想我会用得更频繁。目前,我有一个非常轻量的框架 —— 去除了所有非必要功能的 pi 代理(`pi -nc --offline`)加上一段简短的系统提示(https://github.com/ggml-org/llama.cpp/blob/master/.pi/gg/SYSTEM.md)来使其更贴近我的风格。
— Georgi Gerganov (https://news.ycombinator.com/item?id=48555993#48557304),在 Hacker News 上对 Boykis 的《Running local models is good now》(https://vickiboykis.com/2026/06/15/running-local-models-is-good-now/) 一文的评论
相似文章
试了 Qwen3.6-27B-UD-Q6_K_XL.gguf 配 CloudeCode,真不敢相信居然能用
用户报告称,在 RTX 5090 本地运行 Qwen3-27B-UD-Q6_K_XL.gguf,200K 上下文速度约 50 tok/s,编码表现出乎意料地可用,标志着本地模型质量大幅跃升。
Qwen3.6-27B-GGUF 重磅发布!
社区 GGUF 版本上线,Qwen 27B 混合架构模型支持 262K 上下文、多模态输入、工具调用,并保留“思考过程”,专为智能体编程而生。
Qwen 3.6 35B A3B 的热度绝非虚名!
作者对小型本地 LLM 进行了基准测试,重点突出了 Qwen 3.6 35B A3B,其将学术代码与研究论文进行映射的能力优于 Gemma 4 和 Nemotron 3 Nano 等模型。
高显存本地编码模型——依然首选 Qwen 3.6 27B 吗?
用户分享了使用 Qwen 3.6 27B 进行本地编码任务的经验,并寻求适合拥有 224GB 显存系统的更大模型(100B 以上)的推荐。
Qwen/Qwen3.6-27B
Qwen 在 Hugging Face 上发布了开源权重模型 Qwen3.6-27B,该模型具备更高的稳定性、强大的智能体编程能力以及思维链保留特性,有助于提升开发者的工作效率。