苹果发布全新 Apple Silicon 端侧推理引擎

Reddit r/LocalLLaMA 产品

摘要

苹果在 WWDC 上发布了 CoreAI,这是一款适用于 Apple Silicon 的全新端侧推理引擎,将取代 CoreML,并通过优化推理支持多达 200 亿参数的更大模型,重点面向手机和平板设备。

这则消息似乎并未引起太多关注。苹果在 WWDC 上发布了 CoreAI,它本质上是对 CoreML 的后续替代方案,也是 MLX/llama.cpp/torch 的替代品,用于设备端优化的推理,尤其是手机和平板。模型权重需要通过 Python 脚本进行类似 CoreML 的转换,目前支持的模型列表主要来自 2025 年中,详见 [https://github.com/apple/coreai-models/tree/main/models](https://github.com/apple/coreai-models/tree/main/models) 。对于好奇者来说,这有何新意?CoreML 本身甚至不支持超过几十亿参数的模型,且支持的运算操作非常有限。这意味着 ANE 运算也将迎来重大更新。目前尚无性能数据,很可能当下其在 GPU 上的表现不如纯 MLX。另一个有趣的点是,他们宣称能够将 200 亿参数的模型部署到设备上用于基础模型 [https://machinelearning.apple.com/research/introducing-third-generation-of-apple-foundation-models](https://machinelearning.apple.com/research/introducing-third-generation-of-apple-foundation-models),这看起来像是懒加载的 MoE,因此 CoreAI 可能也允许将更大的模型与应用一起部署。
查看原文

相似文章

Apple Core AI Framework

Hacker News Top

Apple 推出 Core AI Framework,一种用于设备端机器学习的新工具。

苹果发布基于谷歌Gemini模型构建的新AI架构

Hacker News Top

苹果宣布对其Apple Intelligence平台进行重大改革,发布了一套与谷歌合作、基于Gemini技术共同开发的基础模型构建的新AI架构,该架构支持多模态能力,并通过Private Cloud Compute实现隐私保护的设备端与服务器端处理。

Apple 发布 Siri AI 及其下一代 Apple Intelligence

The Verge

Apple 在 WWDC 上推出全新 Siri AI,基于与 Google 合作开发的新 Apple Foundation Models,具备对话式界面、系统集成和隐私优先处理,并将在其设备生态系统中逐步推出。