首次实现本地真实编程工作

Reddit r/LocalLLaMA 工具

摘要

开发者借助 Qwen3.6-35B 4-bit MLX 模型与 pi.dev 工具,在当前硬件上实现了高效的本地智能体编程,顺利完成了实际项目工单。

我以为要在本地进行真实的编程工作还需要很长一段时间(并且得用上未来的 MacBook),但没想到它现在就在我眼前发生了!我正在使用 ~~qwen3.5 35b~~ 编辑:qwen**3.6** 35B(MLX 4-bit 版本,运行于 omlx)。它虽然无法与超大模型相提并论,但它是第一个开始跨越「具备生产力的 AI 智能体」这条红线的模型。它的智能程度足以不仅限于聊天问答,还能解决问题、编写代码以及调用外部工具。而且速度非常快。另一个关键问题是如何赋予它执行智能体任务的能力。我试用过的绝大多数工具(如 Claude Code、OpenCode、Codex CLI 等)都过度依赖极其庞大的提示词注入。它们太过沉重,导致提示词处理耗时极长,内存直接爆满。所以我一度认为,直到换新笔记本之前,我都没法在本地有效利用 AI 智能体。也许等到用上搭载 M7 或 M8 芯片的设备才行吧,哈哈。但后来我开始测试 pi(pi.dev),借助它我已经成功完成了真实项目中的 3 个实际工单!它在理解项目结构时非常高效,只会按需读取必要的代码文件。其中一个工单它一次性就搞定,仅消耗了约 7K tokens!!对于另外两个,我不得不将浏览器控制台的报错信息反馈给它(我想如果增加检查 Playwright 测试结果以闭环任务的规则,体验会更好)。目前唯一烦人的问题是,当 qwen3.6 陷入思考死循环时。我采用的是官方提供的带推理的代码采样配置:`Thinking mode for precise coding tasks (e.g. WebDev): temperature=0.6, top_p=0.95, top_k=20, min_p=0.0, presence_penalty=0.0, repetition_penalty=1.0` 此外我在 omlx 中配置了 126K 的上下文窗口。也许是 4-bit MLX 量化引起的兼容性问题?
查看原文

相似文章