我为Apple Silicon打造了最快的本地AI引擎。专为代理式使用优化。

Reddit r/LocalLLaMA 工具

摘要

作者宣布发布'lightning-mlx',这是一个针对Apple Silicon优化的本地AI引擎,可为编码代理和工具调用工作流实现高令牌速度。

https://preview.redd.it/p0rqofxvrtzg1.png?width=1460&format=png&auto=webp&s=8ce5b18b4ddaad9b71f71fd8eb623839fc9c6c8b 几周来我一直在为Apple Silicon打造最快的本地AI引擎……我终于做到了!它专为代理式使用优化,特别聚焦于编码代理、工具调用和短轮次工作流。仓库:[https://github.com/samuelfaj/lightning-mlx](https://github.com/samuelfaj/lightning-mlx) 来自我的Macbook Max M5(128GB)的一些结果:* Qwen3.6-27B **40.67 tok/s** * Qwen3.6-35B-A3B **220.86 tok/s** 欢迎就以下方面提供反馈:1. 针对本地编码代理的更好基准设计 2. MTPLX预设默认值是否合理 3. 应测试的其他Apple Silicon配置
查看原文

相似文章

mlx-code — 用于Apple Silicon的本地LLM编码代理

Reddit r/artificial

mlx-code是一个Python包,为Apple Silicon提供了一个本地优先的LLM编码代理,集成了MLX推理服务器、多协议API支持、git工作树隔离以及可组合的多智能体原语。

New MLX LM Server From Apple

Reddit r/LocalLLaMA

Apple MLX 团队推出 MLX LM Server,一个在 Mac 上完全本地运行 AI 智能体工作流的工具,支持连续批处理、分布式推理和 M5 神经加速,无需云端或 API 密钥。