@sudoingX：更新：Qwen 3.6 27b dense q4 在单张 3090 上一次生成了 Octopus Invaders 游戏。Hermes Agent 驱动了整个事…

X AI KOLs Timeline 2026/05/11 14:38 模型

open-source code-generation local-inference benchmark agentic-workflow quantization

摘要

用户基准测试表明，Qwen 3.6 27B dense 模型（Q4 量化）能够在单张 RTX 3090 上通过单次提示自主生成一个完全可玩的多文件游戏，性能显著优于其前代版本，且无需任何人工干预。测试结果突显了在消费级硬件上本地代码生成和智能体能力方面的重大改进。

更新：Qwen 3.6 27b dense q4 在单张 3090 上一次生成了 Octopus Invaders 游戏。Hermes Agent 驱动了整个流程，生成速度约 41 tok/s，占用 21GB 显存，满负载 262k 上下文，思考模式开启。输入一个提示，即刻输出标准的可玩多文件太空射击游戏基准，这是我今年三月在同一张显卡上用 Qwen 3.5 27b dense 跑过的完全相同的提示。3.5 版本在游戏首次运行时甚至需要先修复一个外部作用域 bug 才能加载。3.6 则无需任何操作。11/11 文件写入完成，共 2411 行代码，零引导干预，零外部修复，首次加载即可游玩。从提示到可玩状态，实际耗时 16 分 41 秒。今晚，单张 3090 上的消费级王者已然锁定，而我桌下的硬件从三月到现在并未更换。开源生态的基础门槛刚刚提升。看它自我交付吧，全程 16 分 41 秒加速至 3 分 45 秒，从第一条提示到最后一帧画面，无人触碰键盘。

查看原文

相似文章

Wow！Qwen 3.6:35b-a3b 在 3090 上……太惊人了。

Reddit r/artificial

一位用户分享了在二手 RTX 3090 上运行量化版 Qwen 3.6:35b-a3b 模型的惊人结果：将模型放入显存后，输出速度达到每秒 160 个 token，并以 75 秒的视频处理时间展示了视觉能力。

@ItsmeAjayKV: 成就解锁：得益于RTX 3090，现在我可以运行Qwen3.6-27b密集模型。正在运行 @Alibaba_Qwen Qwen 3…

X AI KOLs Timeline

用户使用llama.cpp在RTX 3090上对Qwen3.6-27B进行基准测试，实现了35 tok/s的生成速度和1247 tok/s的提示处理速度。

@DeepTechTR: Qwen 3.6 27B 在16 GB VRAM下速度极快！Pure Quant技术带来的影响——27B模型流畅运行的时代已来临……

X AI KOLs Timeline

Qwen 3.6 27B 在16 GB VRAM上运行快速，得益于'Pure Quant'技术，通过MTP达到40 tokens/s，并支持64k上下文，使得本地AI能在RTX 4060 Ti等消费级GPU上运行。

@seclink: 这家伙刚刚在一块单张 3090 显卡上，跑出了 Qwen 3.5-27B Dense 模型 134 tok/s 的速度，以及新版 Qwen 3.6-27B 模型 73 tok/s 的速度。2026 年的开源社区，其发展速度简直如神速一般。…

X AI KOLs Following

A single RTX 3090 achieves 134 tok/s on the new 27B Qwen 3.5 Dense and 73 tok/s on Qwen 3.6-27B using fused kernels and speculative decoding, with same-day GGUF releases.

@cniongolo: 我不确定大家是否已经意识到，你实际上可以在双 GPU 上运行 Qwen3.6-35B-A3B-Claude-4.7-Opus-abliterated-MTP-GGUF…