@Underfox3: 本文基于对 Apple 硅芯片的直接测量,呈现了 Apple Neural Engine 的全面指南,…
摘要
一份全面的 Apple Neural Engine 逆向工程指南,详细介绍了其在 A11 至 A18 和 M1 至 M5 芯片上的架构、编程接口和性能,基于对私有运行时、编译器和固件的直接测量和静态分析。
查看缓存全文
缓存时间: 2026/06/29 06:24
本文基于对 Apple 芯片的直接测量以及对私有运行时、编译器、内核驱动和固件的静态分析,全面介绍了 Apple 神经网络引擎。
https://t.co/eDdqDtT2yq https://t.co/pXMIxaWPVk
Apple 神经网络引擎:架构、编程与性能
来源:https://arxiv.org/abs/2606.22283 查看 PDF (https://arxiv.org/pdf/2606.22283)
摘要:Apple 神经网络引擎 (ANE) 是自 A11 级 iPhone 和 iPad 芯片以及 M1 级 Mac 芯片以来,Apple 系统级芯片中所搭载的固定功能矩阵加速器,应用程序仅能通过 Core ML 模型框架使用。本指南基于对 Apple 芯片的直接测量以及对私有运行时、编译器、内核驱动和固件的静态分析,提供了该引擎的反向工程描述。它记录了决定引擎吞吐量和能效的数据通路和屋顶线、到达 Core ML 之下的调度路径、编译器与磁盘程序格式、权重压缩方案,以及底层的内核驱动、固件和命令协议。本说明涵盖 A11 至 A18 以及 M1 至 M5 系列,提供每个芯片的目标表以及按设备划分的操作矩阵;直接测量在 M1 和 M5 上进行。各项声明均标注为测量所得、反编译推导或预测所得,并记录了方法论和未决问题。直接从用户空间调用的途径是可行的,但该途径未获文档支持、不受官方支持且版本脆弱;其用途仅限于测量、研究和设备端工作,不适用于生产软件,Core ML 仍然是受支持的路径。
提交历史
来自:Spencer Bryngelson [查看电子邮件 (https://arxiv.org/show-email/cf3990d2/2606.22283)] [v1] 2026 年 6 月 21 日星期日 00:17:34 UTC (407 KB)
相似文章
Apple Neural Engine: 架构、编程与性能
本文基于直接测量和静态分析,对A11-A18及M1-M5芯片中Apple Neural Engine(ANE)的架构、编程及性能进行了逆向工程解析。
@0x0SojalSec:苹果在每台 M4 Mac 和 iPhone 中隐藏了 15.8 TFLOPS 的原始 AI 算力。他们只允许你使用神经网络引擎进行推理。……
一位开发者逆向工程了苹果的私有 API,使得在 M4 Mac 和 iPhone 的 Apple 神经网络引擎(ANE)上直接训练神经网络成为可能,绕过了 CoreML 和 GPU。该项目表明 ANE 硬件能够进行训练,尽管存在利用率低以及某些操作回退到 CPU 等限制。
苹果发布全新 Apple Silicon 端侧推理引擎
苹果在 WWDC 上发布了 CoreAI,这是一款适用于 Apple Silicon 的全新端侧推理引擎,将取代 CoreML,并通过优化推理支持多达 200 亿参数的更大模型,重点面向手机和平板设备。
Apple M1 Chip Deep-Dive
本文通过高分辨率显微照片深入分析了Apple M1芯片的内部结构、晶体管布局、内存接口和主要功能块,展示了其在性能与效率上的革命性突破。
@akshay_pachaar: 苹果终于做到了。其新框架 Core AI 完全在 Apple 芯片上运行模型,因此推理发生在用户设备上…
苹果发布了 Core AI,这是一个新框架,可在 Apple 硅设备(iPhone、iPad、Mac、Vision Pro)上完全运行 AI 模型,无需服务器调用。它包含一个内存安全的 Swift API、用于 PyTorch 的模型导出配方、一个优化器和调试工具,支持 Qwen、Mistral 和 SAM3 等模型。