苹果发布全新 Apple Silicon 端侧推理引擎
摘要
苹果在 WWDC 上发布了 CoreAI,这是一款适用于 Apple Silicon 的全新端侧推理引擎,将取代 CoreML,并通过优化推理支持多达 200 亿参数的更大模型,重点面向手机和平板设备。
这则消息似乎并未引起太多关注。苹果在 WWDC 上发布了 CoreAI,它本质上是对 CoreML 的后续替代方案,也是 MLX/llama.cpp/torch 的替代品,用于设备端优化的推理,尤其是手机和平板。模型权重需要通过 Python 脚本进行类似 CoreML 的转换,目前支持的模型列表主要来自 2025 年中,详见 [https://github.com/apple/coreai-models/tree/main/models](https://github.com/apple/coreai-models/tree/main/models) 。对于好奇者来说,这有何新意?CoreML 本身甚至不支持超过几十亿参数的模型,且支持的运算操作非常有限。这意味着 ANE 运算也将迎来重大更新。目前尚无性能数据,很可能当下其在 GPU 上的表现不如纯 MLX。另一个有趣的点是,他们宣称能够将 200 亿参数的模型部署到设备上用于基础模型 [https://machinelearning.apple.com/research/introducing-third-generation-of-apple-foundation-models](https://machinelearning.apple.com/research/introducing-third-generation-of-apple-foundation-models),这看起来像是懒加载的 MoE,因此 CoreAI 可能也允许将更大的模型与应用一起部署。
相似文章
@akshay_pachaar: 苹果终于做到了。其新框架 Core AI 完全在 Apple 芯片上运行模型,因此推理发生在用户设备上…
苹果发布了 Core AI,这是一个新框架,可在 Apple 硅设备(iPhone、iPad、Mac、Vision Pro)上完全运行 AI 模型,无需服务器调用。它包含一个内存安全的 Swift API、用于 PyTorch 的模型导出配方、一个优化器和调试工具,支持 Qwen、Mistral 和 SAM3 等模型。
Apple Core AI Framework
Apple 推出 Core AI Framework,一种用于设备端机器学习的新工具。
苹果押注AI靠硬件,而非软件
苹果赌定AI的未来取决于定制硬件与iPhone先进处理器实现的本地推理,而非云端大模型。
苹果发布基于谷歌Gemini模型构建的新AI架构
苹果宣布对其Apple Intelligence平台进行重大改革,发布了一套与谷歌合作、基于Gemini技术共同开发的基础模型构建的新AI架构,该架构支持多模态能力,并通过Private Cloud Compute实现隐私保护的设备端与服务器端处理。
Apple 发布 Siri AI 及其下一代 Apple Intelligence
Apple 在 WWDC 上推出全新 Siri AI,基于与 Google 合作开发的新 Apple Foundation Models,具备对话式界面、系统集成和隐私优先处理,并将在其设备生态系统中逐步推出。