@jundotkim: oMLX 0.3.9rc1 发布。亮点：- 低内存Mac保持稳定，不再被系统杀死 - DFlash 升级至…

X AI KOLs Timeline 2026/05/19 09:23 工具

mlx llm-inference macos release open-source apple-silicon continuous-batching

摘要

oMLX 0.3.9rc1，一个为Apple Silicon Mac优化的LLM推理服务器，增加了低内存稳定性、分块预填充、多任务管理聊天等功能。

oMLX 0.3.9rc1 发布。亮点： - 低内存Mac保持稳定，不再被系统杀死 - DFlash 升级至 v0.1.7（感谢 @bstnxbt 的 dflash-mlx）。Qwen 思考/GDN 修复等。 - 分块预填充。长提示不再阻塞其他用户的解码 - 管理聊天中的多任务处理。并行运行多个聊天 - 管理仪表板中的实时内存条 - Hermes Agent 快速启动，"omlx launch hermes" 此外，这个周期还修复了大量bug并迎来了新贡献者。感谢大家！ https://github.com/jundot/omlx/releases/tag/v0.3.9rc1…

查看原文

查看缓存全文

缓存时间: 2026/05/19 14:46

oMLX

专为你的Mac优化的LLM推理引擎
支持连续批处理与分层KV缓存，直接在菜单栏中管理。

[email protected] · https://omlx.ai/me

安装 · 快速入门 · 功能 · 模型 · CLI 配置 · 基准测试 · oMLX.ai

English · 中文 · 한국어 · 日本語

@jundotkim: oMLX 0.3.9rc1 发布。亮点：- 低内存Mac保持稳定，不再被系统杀死 - DFlash 升级至…

相似文章

@jundotkim: oMLX 0.3.9.dev2 已发布。亮点包括：- 视觉路径上的 Gemma 4 MTP（感谢 @Prince_Canuma 的 mlx-vlm）。图像+文本的解码速度显著提升 -...

jundot/omlx

@jundotkim：我刚发布了 oMLX v0.4.0，这是首个搭载全新原生 Swift macOS 应用的正式版本。

@AlexJonesax: 如果你在 Mac 上运行 LLM，值得了解的两个开源 MLX 推理服务器：MTPLX (@youssofal) 利用模型自身的…

我构建了mlx-Chronos——一个面向Apple Silicon上本地LLM引擎的社区基准测试排行榜（oMLX、Rapid-MLX、mlx-lm、Ollama）

提交意见反馈