mlx

#mlx

@dealignai: DeepSeek-V4-Flash 破解版（已消融/未审查） - 仅限Mac (Osaurus/vMLX) https://huggingface.co/dealignai/DeepSeek-V4…

X AI KOLs Timeline ↗ · 2026-05-24 缓存

DeepSeek-V4-Flash 的消融版（未审查），针对 Apple Mac 使用 MLX 进行了优化，移除了拒绝行为，同时保留了知识和推理能力。

0 人收藏 0 人点赞

#mlx

Command A+ (218B MoE) 在 Apple Silicon 上运行 — MLX 移植，PR 已开放

Reddit r/LocalLLaMA ↗ · 2026-05-23

mlx-lm 的一个 PR 为 Cohere 的 Command A+ (218B MoE) 模型在 Apple Silicon 上增加了支持，并附有架构实现细节。

0 人收藏 0 人点赞

#mlx

我在exo中为Qwen3.6 MLX模型添加了原生MTP支持；以下是精确度和速度结果

Reddit r/LocalLLaMA ↗ · 2026-05-23

为exo本地推理工具添加了对Qwen3.6 MLX模型的原生多token预测（MTP）支持，在M5 Max笔记本上对27B模型实现了高达2倍的加速，同时保持精确度。

0 人收藏 0 人点赞

#mlx

HF 将 safetensors 标记为不安全？搞什么？

Reddit r/LocalLLaMA ↗ · 2026-05-21

Hugging Face 将一个 safetensors 文件标记为不安全，让用户感到困惑并质疑这一政策。

0 人收藏 0 人点赞

#mlx

@DanKornas：微调本地大语言模型不应需要租用云端GPU。Silicon Studio 是一款开源桌面应用，适用于本地大语言模型的……

X AI KOLs Following ↗ · 2026-05-21 缓存

Silicon Studio 是一款开源桌面应用，支持在 Apple Silicon Mac 上使用 MLX 进行本地大语言模型微调和推理，具备数据准备、模型管理和可视化配置等功能。

0 人收藏 0 人点赞

#mlx

@adrgrondin: 使用Codex CLI和@lmstudio在MacBook Pro M5上本地同时运行子代理以审查代码并查找漏洞……

X AI KOLs Following ↗ · 2026-05-20 缓存

演示了在MacBook Pro M5上使用Codex CLI和LM Studio（搭载Qwen 3.6，并利用MLX批处理功能）本地运行子代理以进行代码审查和漏洞检测。

0 人收藏 0 人点赞

#mlx

@ivanfioravanti: @awnihannun 的《Writing Fast MLX》技能对任何使用 Apple MLX 框架的人来说都是必备的。

X AI KOLs Timeline ↗ · 2026-05-20 缓存

推荐 Awni Hannun 的《Writing Fast MLX》技能给使用 Apple MLX 框架的开发者的推文。

0 人收藏 0 人点赞

#mlx

@Michaelzsguo: https://x.com/Michaelzsguo/status/2056842405815447684

X AI KOLs Timeline ↗ · 2026-05-19 缓存

一份实用指南，介绍如何通过分层包装系统和一致的目录结构来组织本地LLM实验，以避免模型位置漂移、标志遗忘和测试框架耦合。

0 人收藏 0 人点赞

#mlx

@sabeshbharathi: 想象一个未来，你能在最好的个人AI设备——你的Mac上拥有真正个性化和主动的助手……

X AI KOLs Following ↗ · 2026-05-19 缓存

Sabesh Bharathi 设想在 MacBooks 上使用 MLX 实现个性化主动 AI 助手，并宣布于 5 月 3 日举办了首次 MLX 印度社区聚会。

0 人收藏 0 人点赞

#mlx

@jundotkim: oMLX 0.3.9rc1 发布。亮点：- 低内存Mac保持稳定，不再被系统杀死 - DFlash 升级至…

X AI KOLs Timeline ↗ · 2026-05-19 缓存

oMLX 0.3.9rc1，一个为Apple Silicon Mac优化的LLM推理服务器，增加了低内存稳定性、分块预填充、多任务管理聊天等功能。

0 人收藏 0 人点赞

#mlx

@Prince_Canuma: 关于进水情况的快速更新：M3 Ultra和Titan（RTX6000 Pro）似乎已恢复，几乎没有可见损坏……

X AI KOLs Timeline ↗ · 2026-05-18 缓存

关于硬件进水损坏修复的个人更新，展示MLX-VLM在本地RTX6000 Pro上运行Qwen3-4B-Instruct，以约300 tok/s的速度通过Zed IDE实现自动补全和git提交信息生成。

0 人收藏 0 人点赞

#mlx

MLX引擎对比…oMLX是最佳选择。

Reddit r/LocalLLaMA ↗ · 2026-05-18

一篇博客文章，对比了MLX推理引擎，结论是oMLX是最佳选择，评测在M5 Max 64GB上使用Qwen3.6-35B-A3B-4bit。

0 人收藏 0 人点赞

#mlx

@PyTorch：ExecuTorch 现有一个 MLX 委托，可在 Apple Silicon GPU 上运行 PyTorch 模型。它支持大语言模型、语音转文字、以及……

X AI KOLs Following ↗ · 2026-05-18 缓存

ExecuTorch 现有一个 MLX 委托，可在 Apple Silicon Mac 上为 PyTorch 模型提供 GPU 加速推理，支持大语言模型、语音转文字以及通过 TorchAO 进行量化的 MoE 模型。

0 人收藏 0 人点赞

#mlx

@neural_avb：我正在将SAM模型及其工具套件移植到Apple silicon上。已经在mlx上看到1.25倍推理速度提升……

X AI KOLs Following ↗ · 2026-05-17 缓存

将SAM 2.1模型移植到Apple silicon上（使用MLX），在小模型上实现了1.25倍推理速度提升，计划推出量化版。

0 人收藏 0 人点赞

#mlx

@rohanpaul_ai: 设备端小模型的可能性太多了。@adrgrondin 正在 iPhone 17 Pro 上运行 Google 的 Gemma 4 E2B。大约 4…

X AI KOLs Following ↗ · 2026-05-17 缓存

Google 的 Gemma 4 E2B 通过 MLX 优化在 iPhone 17 Pro 上运行演示，达到约 40 tokens/秒，支持 128K 上下文以及离线思考模式，适用于编程和数学。

0 人收藏 0 人点赞

#mlx

@Michaelzsguo：所以你买了128GB MacBook Pro。现在的问题不是“哪个本地模型的TPS最高？”而是：哪个设…

X AI KOLs Timeline ↗ · 2026-05-17 缓存

这条推文推荐了适用于128GB MacBook Pro的本地AI编程方案，使用Qwen 3.6模型搭配MLX服务器及特定配置，以实现可靠的编程辅助。

0 人收藏 0 人点赞

#mlx

@sitinme: 有一个挺有意思的开源项目，叫 Cider，专门给 Apple Silicon 芯片的 Mac 做本地 AI 推理加速。很多人买了 Mac mini、MacBook Pro ，想在本地跑模型，但总会出现速度不够快、内存吃得猛的情况其实 …

X AI KOLs Timeline ↗ · 2026-05-17 缓存

Cider 是一个开源项目，专为 Apple Silicon Mac 设计，通过充分利用 M 系列芯片的算力来加速本地 AI 推理，适配 MLX 生态，支持 Qwen、Llama 等模型，安装简单。

0 人收藏 0 人点赞

#mlx

昨天我看到一篇关于 δ-mem 并与 openclaw 集成的新研究论文

Reddit r/openclaw ↗ · 2026-05-17

一篇关于 δ-mem 的新研究论文在与 openclaw 集成后，将智能体响应质量提升了 7-32%。该项目目前仅适用于 mlx 和 Qwen3:4b，但预计会推出其他模型的适配器。

0 人收藏 0 人点赞

#mlx

我在Apple Silicon上使用MLX和OpenClaw集成了新的δ-mem研究！我的发现

Reddit r/LocalLLaMA ↗ · 2026-05-16

作者使用MLX和OpenClaw在Apple Silicon上实现了δ-mem研究论文，展示了在本地AI代理测试中的内存和注意力改进，尽管与CUDA基准相比结果好坏参半。

0 人收藏 0 人点赞

#mlx

@nash_su: Mac 推理速度翻倍这个 MTPLX 是 MLX + MTP 的整合解决方案，专门针对 Apple Silicon 进行了模型推理优化，使用加入了定制 MTP head 的模型，可以提供翻倍的推理速度。我测试过了，Qwen3.6-27…

X AI KOLs Timeline ↗ · 2026-05-16 缓存

MTPLX 是 MLX 与 MTP 的整合解决方案，专门针对 Apple Silicon 优化模型推理速度，测试显示 Qwen3.6-27B 推理速度比 LM Studio 翻倍，并集成了风扇管理。

0 人收藏 0 人点赞

mlx

提交意见反馈