@remilouf: 在 @julien_c 的推文之后，我买了一台配备 128B 统一内存的 MacBook Pro，并开始将 Qwen3.6 作为我的日常驱…

X AI KOLs Following 2026/05/10 11:14 新闻

摘要

作者分享了在配备 128GB 统一内存的 MacBook Pro 上运行 Qwen3.6 模型的经验，称赞了苹果硬件在本地 AI 推理方面的效率。

在 @julien_c 的推文之后，我买了一台配备 128B 统一内存的 MacBook Pro，并开始将 Qwen3.6 作为我的日常驱动。这令人费解。苹果在这个行业里比所有人都聪明。

查看原文

查看缓存全文

缓存时间: 2026/05/10 16:27

受到 @julien_c 推特的启发，我入手了一台配备 128GB 统一内存的 MacBook Pro，并开始将 Qwen3.6 作为我的日常主力模型使用。效果令人难以置信。

苹果在这一领域彻底超越了整个行业。

相似文章

@Michaelzsguo：所以你买了128GB MacBook Pro。现在的问题不是“哪个本地模型的TPS最高？”而是：哪个设…

X AI KOLs Timeline

这条推文推荐了适用于128GB MacBook Pro的本地AI编程方案，使用Qwen 3.6模型搭配MLX服务器及特定配置，以实现可靠的编程辅助。

Qwen3.6 35B-A3B在笔记本上的运行：我的从零到一时刻

Reddit r/LocalLLaMA

作者分享了在ASUS Zenbook Pro 14上本地运行Qwen3.6 35B-A3B的体验，在32k上下文下实现了27 TPS的生成速度，标志着向完全本地化AI以保护隐私的个人里程碑。

2台配备 512GB 内存的 M3 Ultra Mac Studio

Reddit r/LocalLLaMA

硬件投入约 2.5 万美元。告诉我你们希望我在这两台设备上部署什么模型，我会协助测试。目前我已通过 Exo 后端跑通了 DeepSeek v3.2 Q8 版本；当前每台设备均在运行 GLM 5.1 Q4（正在排查为何 Exo 无法加载 Q8 版本）。静候社区完成 Kimi 2.6 针对 MLX/mmap 的优化适配。

@rohanpaul_ai: Qwen 3.6 27B 在 MacBook Pro M5 Max 64GB 上达到每秒34个token，本地使用 atomic[.]chat，接受率达90%，即……

X AI KOLs Following

Qwen 3.6 27B 在 MacBook Pro M5 Max 64GB 上本地运行，实现每秒34个token，草稿接受率达90%，通过 TurboQuant、GGUF 和 llama.cpp 实现，展示了笔记本AI推理的重大进步。

@alexocheema：在两台 M5 Max MacBook Pro 上通过 Thunderbolt 5 RDMA 运行 Qwen3.6 35B（视觉版）。模型能描述图片并正确识别 Apple Park，但把 John Ternus 错认成 Jeff Williams。借助前缀缓存，响应几乎瞬间完成。