首次实现本地真实编程工作
摘要
开发者借助 Qwen3.6-35B 4-bit MLX 模型与 pi.dev 工具,在当前硬件上实现了高效的本地智能体编程,顺利完成了实际项目工单。
我以为要在本地进行真实的编程工作还需要很长一段时间(并且得用上未来的 MacBook),但没想到它现在就在我眼前发生了!我正在使用 ~~qwen3.5 35b~~ 编辑:qwen**3.6** 35B(MLX 4-bit 版本,运行于 omlx)。它虽然无法与超大模型相提并论,但它是第一个开始跨越「具备生产力的 AI 智能体」这条红线的模型。它的智能程度足以不仅限于聊天问答,还能解决问题、编写代码以及调用外部工具。而且速度非常快。另一个关键问题是如何赋予它执行智能体任务的能力。我试用过的绝大多数工具(如 Claude Code、OpenCode、Codex CLI 等)都过度依赖极其庞大的提示词注入。它们太过沉重,导致提示词处理耗时极长,内存直接爆满。所以我一度认为,直到换新笔记本之前,我都没法在本地有效利用 AI 智能体。也许等到用上搭载 M7 或 M8 芯片的设备才行吧,哈哈。但后来我开始测试 pi(pi.dev),借助它我已经成功完成了真实项目中的 3 个实际工单!它在理解项目结构时非常高效,只会按需读取必要的代码文件。其中一个工单它一次性就搞定,仅消耗了约 7K tokens!!对于另外两个,我不得不将浏览器控制台的报错信息反馈给它(我想如果增加检查 Playwright 测试结果以闭环任务的规则,体验会更好)。目前唯一烦人的问题是,当 qwen3.6 陷入思考死循环时。我采用的是官方提供的带推理的代码采样配置:`Thinking mode for precise coding tasks (e.g. WebDev): temperature=0.6, top_p=0.95, top_k=20, min_p=0.0, presence_penalty=0.0, repetition_penalty=1.0` 此外我在 omlx 中配置了 126K 的上下文窗口。也许是 4-bit MLX 量化引起的兼容性问题?
相似文章
Qwen3.6 35B + 合适脚手架,本地跑真实 Go 任务 9/10 通过
开发者用 Qwen3.6 35B 为核心,配合 little-coder 脚手架搭建路由本地环境,在 10 个真实 Go 任务中拿到 9/10 通过率,证明本地模型搭配合适工具链也能逼近前沿代码模型。
Pacman 基准测试:终于有了一个可行的本地自主编程代理——Qwen 3.6 27b
作者在 Pacman 编程基准测试上测试了 Qwen 3.6 27b F16,三次尝试中有两次达到了近乎完美的结果,同时指出了量化、聊天模板和推测解码对本地自主编程的关键影响。
本地运行 Qwen3.6-35B-A3B 作为编码 Agent:我的完整部署与可用配置
一份详尽指南,教你如何在 Apple Silicon 上通过 llama.cpp 本地运行 350 亿参数 Qwen3.6 模型,并驱动 pi 编码 Agent,附带优化后的启动参数与采样配置。
Qwen3.6 35B-A3B在笔记本上的运行:我的从零到一时刻
作者分享了在ASUS Zenbook Pro 14上本地运行Qwen3.6 35B-A3B的体验,在32k上下文下实现了27 TPS的生成速度,标志着向完全本地化AI以保护隐私的个人里程碑。
在单个16GB GPU + 64GB RAM上的本地LLM自动补全与代理式编码
使用 llama.cpp 在单块 16GB GPU 及 64GB+ 内存上设置本地 LLM 自动完成(Qwen2.5-Coder-7B)与代理编码(Qwen3.6-35B-A3B)的技术指南,包含命令与性能基准。