@sudoingX:更新:Qwen 3.6 27b dense q4 在单张 3090 上一次生成了 Octopus Invaders 游戏。Hermes Agent 驱动了整个事…

X AI KOLs Timeline 模型

摘要

用户基准测试表明,Qwen 3.6 27B dense 模型(Q4 量化)能够在单张 RTX 3090 上通过单次提示自主生成一个完全可玩的多文件游戏,性能显著优于其前代版本,且无需任何人工干预。测试结果突显了在消费级硬件上本地代码生成和智能体能力方面的重大改进。

更新:Qwen 3.6 27b dense q4 在单张 3090 上一次生成了 Octopus Invaders 游戏。Hermes Agent 驱动了整个流程,生成速度约 41 tok/s,占用 21GB 显存,满负载 262k 上下文,思考模式开启。输入一个提示,即刻输出标准的可玩多文件太空射击游戏基准,这是我今年三月在同一张显卡上用 Qwen 3.5 27b dense 跑过的完全相同的提示。3.5 版本在游戏首次运行时甚至需要先修复一个外部作用域 bug 才能加载。3.6 则无需任何操作。11/11 文件写入完成,共 2411 行代码,零引导干预,零外部修复,首次加载即可游玩。从提示到可玩状态,实际耗时 16 分 41 秒。今晚,单张 3090 上的消费级王者已然锁定,而我桌下的硬件从三月到现在并未更换。开源生态的基础门槛刚刚提升。看它自我交付吧,全程 16 分 41 秒加速至 3 分 45 秒,从第一条提示到最后一帧画面,无人触碰键盘。
查看原文

相似文章

4x RTX 3090 上的 Qwen3.5-27B、Qwen3.5-122B 和 Qwen3.6-35B —— MoE 模型在严格全局规则下的表现困境

Reddit r/LocalLLaMA

潜水多年的老用户,首次发帖。在 4 张 RTX 3090 上对三款 Qwen 模型分别进行了 20 多个会话的实时智能体工作测试——**Qwen3.5-27B** 稠密模型、**Qwen3.5-122B-A10B** MoE 和 **Qwen3.6-35B-A3B** MoE。以下数据均解析自持续真实负载下的 vLLM 日志,而非合成基准测试。**本文所有数据的关键负载背景:** 测试框架是一个多智能体编排器,同时运行 1-6 个并发的 OpenCode 会话,Prompt 长度为 30-60k token,并且强制执行**严格的 Bash 允许列表