@rumgewieselt:现在变得疯狂了……三块 1080 Ti(Pascal架构,33GB VRAM)Qwen 3.6 27B MTP 搭配 196K TurboQuant,持续 ~28-30 t/s

X AI KOLs Timeline 新闻

摘要

一位用户成功在三个 GTX 1080 Ti GPU 上对 27B 参数的 Qwen 模型进行本地推理,通过 TurboQuant 优化达到了约 28-30 tokens/秒的速度。

现在变得疯狂了…… 三块 1080 Ti(Pascal架构,33GB VRAM) Qwen 3.6 27B MTP 搭配 196K TurboQuant 持续 ~28-30 t/s https://t.co/asoDLIrAad
查看原文
查看缓存全文

缓存时间: 2026/05/08 13:32

现在变得疯狂了……

3张1080 Ti(帕斯卡架构,33GB显存)

Qwen 3.6 27B MTP搭配196K TurboQuant 稳定约28-30 t/s https://t.co/asoDLIrAad

相似文章

Wow!Qwen 3.6:35b-a3b 在 3090 上……太惊人了。

Reddit r/artificial

一位用户分享了在二手 RTX 3090 上运行量化版 Qwen 3.6:35b-a3b 模型的惊人结果:将模型放入显存后,输出速度达到每秒 160 个 token,并以 75 秒的视频处理时间展示了视觉能力。