@Underfox3: 本文基于对 Apple 硅芯片的直接测量,呈现了 Apple Neural Engine 的全面指南,…

X AI KOLs Timeline 论文

摘要

一份全面的 Apple Neural Engine 逆向工程指南,详细介绍了其在 A11 至 A18 和 M1 至 M5 芯片上的架构、编程接口和性能,基于对私有运行时、编译器和固件的直接测量和静态分析。

本文基于对 Apple silicon 的直接测量和对私有运行时、编译器、内核驱动和固件的静态分析,呈现了 Apple Neural Engine 的全面指南。 https://t.co/eDdqDtT2yq https://t.co/pXMIxaWPVk
查看原文
查看缓存全文

缓存时间: 2026/06/29 06:24

本文基于对 Apple 芯片的直接测量以及对私有运行时、编译器、内核驱动和固件的静态分析,全面介绍了 Apple 神经网络引擎。

https://t.co/eDdqDtT2yq https://t.co/pXMIxaWPVk


Apple 神经网络引擎:架构、编程与性能

来源:https://arxiv.org/abs/2606.22283 查看 PDF (https://arxiv.org/pdf/2606.22283)

摘要:Apple 神经网络引擎 (ANE) 是自 A11 级 iPhone 和 iPad 芯片以及 M1 级 Mac 芯片以来,Apple 系统级芯片中所搭载的固定功能矩阵加速器,应用程序仅能通过 Core ML 模型框架使用。本指南基于对 Apple 芯片的直接测量以及对私有运行时、编译器、内核驱动和固件的静态分析,提供了该引擎的反向工程描述。它记录了决定引擎吞吐量和能效的数据通路和屋顶线、到达 Core ML 之下的调度路径、编译器与磁盘程序格式、权重压缩方案,以及底层的内核驱动、固件和命令协议。本说明涵盖 A11 至 A18 以及 M1 至 M5 系列,提供每个芯片的目标表以及按设备划分的操作矩阵;直接测量在 M1 和 M5 上进行。各项声明均标注为测量所得、反编译推导或预测所得,并记录了方法论和未决问题。直接从用户空间调用的途径是可行的,但该途径未获文档支持、不受官方支持且版本脆弱;其用途仅限于测量、研究和设备端工作,不适用于生产软件,Core ML 仍然是受支持的路径。

提交历史

来自:Spencer Bryngelson [查看电子邮件 (https://arxiv.org/show-email/cf3990d2/2606.22283)] [v1] 2026 年 6 月 21 日星期日 00:17:34 UTC (407 KB)

相似文章

苹果发布全新 Apple Silicon 端侧推理引擎

Reddit r/LocalLLaMA

苹果在 WWDC 上发布了 CoreAI,这是一款适用于 Apple Silicon 的全新端侧推理引擎,将取代 CoreML,并通过优化推理支持多达 200 亿参数的更大模型,重点面向手机和平板设备。

Apple M1 Chip Deep-Dive

Lobsters Hottest

本文通过高分辨率显微照片深入分析了Apple M1芯片的内部结构、晶体管布局、内存接口和主要功能块,展示了其在性能与效率上的革命性突破。