mlx

标签

Cards List
#mlx

@dealignai: DeepSeek-V4-Flash 破解版(已消融/未审查) - 仅限Mac (Osaurus/vMLX) https://huggingface.co/dealignai/DeepSeek-V4…

X AI KOLs Timeline · 2026-05-24 缓存

DeepSeek-V4-Flash 的消融版(未审查),针对 Apple Mac 使用 MLX 进行了优化,移除了拒绝行为,同时保留了知识和推理能力。

0 人收藏 0 人点赞
#mlx

Command A+ (218B MoE) 在 Apple Silicon 上运行 — MLX 移植,PR 已开放

Reddit r/LocalLLaMA · 2026-05-23

mlx-lm 的一个 PR 为 Cohere 的 Command A+ (218B MoE) 模型在 Apple Silicon 上增加了支持,并附有架构实现细节。

0 人收藏 0 人点赞
#mlx

我在exo中为Qwen3.6 MLX模型添加了原生MTP支持;以下是精确度和速度结果

Reddit r/LocalLLaMA · 2026-05-23

为exo本地推理工具添加了对Qwen3.6 MLX模型的原生多token预测(MTP)支持,在M5 Max笔记本上对27B模型实现了高达2倍的加速,同时保持精确度。

0 人收藏 0 人点赞
#mlx

HF 将 safetensors 标记为不安全?搞什么?

Reddit r/LocalLLaMA · 2026-05-21

Hugging Face 将一个 safetensors 文件标记为不安全,让用户感到困惑并质疑这一政策。

0 人收藏 0 人点赞
#mlx

@DanKornas:微调本地大语言模型不应需要租用云端GPU。Silicon Studio 是一款开源桌面应用,适用于本地大语言模型的……

X AI KOLs Following · 2026-05-21 缓存

Silicon Studio 是一款开源桌面应用,支持在 Apple Silicon Mac 上使用 MLX 进行本地大语言模型微调和推理,具备数据准备、模型管理和可视化配置等功能。

0 人收藏 0 人点赞
#mlx

@adrgrondin: 使用Codex CLI和@lmstudio在MacBook Pro M5上本地同时运行子代理以审查代码并查找漏洞……

X AI KOLs Following · 2026-05-20 缓存

演示了在MacBook Pro M5上使用Codex CLI和LM Studio(搭载Qwen 3.6,并利用MLX批处理功能)本地运行子代理以进行代码审查和漏洞检测。

0 人收藏 0 人点赞
#mlx

@ivanfioravanti: @awnihannun 的《Writing Fast MLX》技能对任何使用 Apple MLX 框架的人来说都是必备的。

X AI KOLs Timeline · 2026-05-20 缓存

推荐 Awni Hannun 的《Writing Fast MLX》技能给使用 Apple MLX 框架的开发者的推文。

0 人收藏 0 人点赞
#mlx

@Michaelzsguo: https://x.com/Michaelzsguo/status/2056842405815447684

X AI KOLs Timeline · 2026-05-19 缓存

一份实用指南,介绍如何通过分层包装系统和一致的目录结构来组织本地LLM实验,以避免模型位置漂移、标志遗忘和测试框架耦合。

0 人收藏 0 人点赞
#mlx

@sabeshbharathi: 想象一个未来,你能在最好的个人AI设备——你的Mac上拥有真正个性化和主动的助手……

X AI KOLs Following · 2026-05-19 缓存

Sabesh Bharathi 设想在 MacBooks 上使用 MLX 实现个性化主动 AI 助手,并宣布于 5 月 3 日举办了首次 MLX 印度社区聚会。

0 人收藏 0 人点赞
#mlx

@jundotkim: oMLX 0.3.9rc1 发布。亮点:- 低内存Mac保持稳定,不再被系统杀死 - DFlash 升级至…

X AI KOLs Timeline · 2026-05-19 缓存

oMLX 0.3.9rc1,一个为Apple Silicon Mac优化的LLM推理服务器,增加了低内存稳定性、分块预填充、多任务管理聊天等功能。

0 人收藏 0 人点赞
#mlx

@Prince_Canuma: 关于进水情况的快速更新:M3 Ultra和Titan(RTX6000 Pro)似乎已恢复,几乎没有可见损坏……

X AI KOLs Timeline · 2026-05-18 缓存

关于硬件进水损坏修复的个人更新,展示MLX-VLM在本地RTX6000 Pro上运行Qwen3-4B-Instruct,以约300 tok/s的速度通过Zed IDE实现自动补全和git提交信息生成。

0 人收藏 0 人点赞
#mlx

MLX引擎对比…oMLX是最佳选择。

Reddit r/LocalLLaMA · 2026-05-18

一篇博客文章,对比了MLX推理引擎,结论是oMLX是最佳选择,评测在M5 Max 64GB上使用Qwen3.6-35B-A3B-4bit。

0 人收藏 0 人点赞
#mlx

@PyTorch:ExecuTorch 现有一个 MLX 委托,可在 Apple Silicon GPU 上运行 PyTorch 模型。它支持大语言模型、语音转文字、以及……

X AI KOLs Following · 2026-05-18 缓存

ExecuTorch 现有一个 MLX 委托,可在 Apple Silicon Mac 上为 PyTorch 模型提供 GPU 加速推理,支持大语言模型、语音转文字以及通过 TorchAO 进行量化的 MoE 模型。

0 人收藏 0 人点赞
#mlx

@neural_avb:我正在将SAM模型及其工具套件移植到Apple silicon上。已经在mlx上看到1.25倍推理速度提升……

X AI KOLs Following · 2026-05-17 缓存

将SAM 2.1模型移植到Apple silicon上(使用MLX),在小模型上实现了1.25倍推理速度提升,计划推出量化版。

0 人收藏 0 人点赞
#mlx

@rohanpaul_ai: 设备端小模型的可能性太多了。@adrgrondin 正在 iPhone 17 Pro 上运行 Google 的 Gemma 4 E2B。大约 4…

X AI KOLs Following · 2026-05-17 缓存

Google 的 Gemma 4 E2B 通过 MLX 优化在 iPhone 17 Pro 上运行演示,达到约 40 tokens/秒,支持 128K 上下文以及离线思考模式,适用于编程和数学。

0 人收藏 0 人点赞
#mlx

@Michaelzsguo:所以你买了128GB MacBook Pro。现在的问题不是“哪个本地模型的TPS最高?”而是:哪个设…

X AI KOLs Timeline · 2026-05-17 缓存

这条推文推荐了适用于128GB MacBook Pro的本地AI编程方案,使用Qwen 3.6模型搭配MLX服务器及特定配置,以实现可靠的编程辅助。

0 人收藏 0 人点赞
#mlx

@sitinme: 有一个挺有意思的开源项目,叫 Cider,专门给 Apple Silicon 芯片的 Mac 做本地 AI 推理加速。 很多人买了 Mac mini、MacBook Pro ,想在本地跑模型,但总会出现速度不够快、内存吃得猛的情况 其实 …

X AI KOLs Timeline · 2026-05-17 缓存

Cider 是一个开源项目,专为 Apple Silicon Mac 设计,通过充分利用 M 系列芯片的算力来加速本地 AI 推理,适配 MLX 生态,支持 Qwen、Llama 等模型,安装简单。

0 人收藏 0 人点赞
#mlx

昨天我看到一篇关于 δ-mem 并与 openclaw 集成的新研究论文

Reddit r/openclaw · 2026-05-17

一篇关于 δ-mem 的新研究论文在与 openclaw 集成后,将智能体响应质量提升了 7-32%。该项目目前仅适用于 mlx 和 Qwen3:4b,但预计会推出其他模型的适配器。

0 人收藏 0 人点赞
#mlx

我在Apple Silicon上使用MLX和OpenClaw集成了新的δ-mem研究!我的发现

Reddit r/LocalLLaMA · 2026-05-16

作者使用MLX和OpenClaw在Apple Silicon上实现了δ-mem研究论文,展示了在本地AI代理测试中的内存和注意力改进,尽管与CUDA基准相比结果好坏参半。

0 人收藏 0 人点赞
#mlx

@nash_su: Mac 推理速度翻倍 这个 MTPLX 是 MLX + MTP 的整合解决方案,专门针对 Apple Silicon 进行了模型推理优化,使用加入了定制 MTP head 的模型,可以提供翻倍的推理速度。 我测试过了,Qwen3.6-27…

X AI KOLs Timeline · 2026-05-16 缓存

MTPLX 是 MLX 与 MTP 的整合解决方案,专门针对 Apple Silicon 优化模型推理速度,测试显示 Qwen3.6-27B 推理速度比 LM Studio 翻倍,并集成了风扇管理。

0 人收藏 0 人点赞
← Previous
Next →
← 返回首页

提交意见反馈