首次实现本地真实编程工作

Reddit r/LocalLLaMA 2026/04/21 11:42 工具

摘要

开发者借助 Qwen3.6-35B 4-bit MLX 模型与 pi.dev 工具，在当前硬件上实现了高效的本地智能体编程，顺利完成了实际项目工单。

我以为要在本地进行真实的编程工作还需要很长一段时间（并且得用上未来的 MacBook），但没想到它现在就在我眼前发生了！我正在使用 ~~qwen3.5 35b~~ 编辑：qwen**3.6** 35B（MLX 4-bit 版本，运行于 omlx）。它虽然无法与超大模型相提并论，但它是第一个开始跨越「具备生产力的 AI 智能体」这条红线的模型。它的智能程度足以不仅限于聊天问答，还能解决问题、编写代码以及调用外部工具。而且速度非常快。另一个关键问题是如何赋予它执行智能体任务的能力。我试用过的绝大多数工具（如 Claude Code、OpenCode、Codex CLI 等）都过度依赖极其庞大的提示词注入。它们太过沉重，导致提示词处理耗时极长，内存直接爆满。所以我一度认为，直到换新笔记本之前，我都没法在本地有效利用 AI 智能体。也许等到用上搭载 M7 或 M8 芯片的设备才行吧，哈哈。但后来我开始测试 pi（pi.dev），借助它我已经成功完成了真实项目中的 3 个实际工单！它在理解项目结构时非常高效，只会按需读取必要的代码文件。其中一个工单它一次性就搞定，仅消耗了约 7K tokens！！对于另外两个，我不得不将浏览器控制台的报错信息反馈给它（我想如果增加检查 Playwright 测试结果以闭环任务的规则，体验会更好）。目前唯一烦人的问题是，当 qwen3.6 陷入思考死循环时。我采用的是官方提供的带推理的代码采样配置：`Thinking mode for precise coding tasks (e.g. WebDev): temperature=0.6, top_p=0.95, top_k=20, min_p=0.0, presence_penalty=0.0, repetition_penalty=1.0` 此外我在 omlx 中配置了 126K 的上下文窗口。也许是 4-bit MLX 量化引起的兼容性问题？

查看原文

首次实现本地真实编程工作

相似文章

Qwen3.6 35B + 合适脚手架，本地跑真实 Go 任务 9/10 通过

Pacman 基准测试：终于有了一个可行的本地自主编程代理——Qwen 3.6 27b

本地运行 Qwen3.6-35B-A3B 作为编码 Agent：我的完整部署与可用配置

Qwen3.6 35B-A3B在笔记本上的运行：我的从零到一时刻

在单个16GB GPU + 64GB RAM上的本地LLM自动补全与代理式编码

提交意见反馈