[x86] AI计算扩展(ACE)规范
摘要
x86生态系统咨询小组发布了AI计算扩展(ACE)规范,该规范定义了新的x86指令和寄存器状态,用于加速机器学习工作负载中的矩阵乘法和低精度数据格式。
暂无内容
查看缓存全文
缓存时间: 2026/06/18 05:47
# AI 计算扩展 (ACE) 规范 – x86 生态系统咨询小组
来源:https://x86ecosystem.org/resource/ai-compute-extensions-ace-specification/
- 2026年6月15日
本文档定义了用于加速计算任务的 x86 扩展,初始重点放在矩阵乘法内核和对机器学习工作负载至关重要的低精度数据格式上。
ACE 扩展定义了矩阵乘法原语,通过以下新功能增强了 AVX 和标量代码:
- ACE 寄存器状态,包括磁贴和块缩放寄存器
- 数据运算处理操作,消耗 AVX 寄存器输入并对磁贴寄存器状态进行操作
- 数据移动操作,在 ACE 寄存器状态和 AVX 寄存器之间移动数据
- 系统管理的状态和操作
ACE 在 AVX 向量和 ACE 磁贴寄存器之间提供了紧密集成,将高计算密度的磁贴处理操作与 AVX 的全面数据处理功能相结合。
除了矩阵加速之外,在 AVX10 框架下还提供了一系列专用的格式转换操作。
相似文章
AMD AI ENGAGE
本文讨论了 AMD AI Engage 计划,这是一个面向 AI 开发者的社区倡议,为构建大语言模型(LLM)应用和生成式 AI 工作流提供奖金、积分以及交流机会。
@sumitdotml: 2026年第25周:C语言中CPU张量核心基础(加法/乘法、归约、步长、2D矩阵乘法等),阅读Arcee的一些内容
作者分享了用C语言构建纯CPU张量库的进展,涵盖了加法/乘法、归约、步长和2D矩阵乘法等基础知识,以及从阅读Arcee关于基础模型的技术博客中获得的见解。
AMD凭借全新Ryzen AI Halo开发者平台和Ryzen AI Max PRO 400系列处理器驱动下一代智能体计算机
AMD宣布推出用于本地AI开发的Ryzen AI Halo开发者平台(可运行高达200B参数的模型)以及面向商业AI PC的Ryzen AI Max PRO 400系列处理器,可在本地支持智能体AI工作负载。
在Ryzen AI 7 350 NPU上达到峰值TOPS性能
关于在AMD Ryzen AI 7 350 NPU上实现峰值TOPS性能的技术深度剖析,与Xilinx AIE-ML v2 AI引擎进行比较,并解释用于矩阵乘法工作负载的硬件架构。
AlphaEvolve:一个由Gemini驱动的编码智能体,用于设计先进算法
DeepMind发布AlphaEvolve,这是一个由Gemini驱动的AI智能体,它将大型语言模型与自动评估器相结合,能够发现并优化用于数学和实际计算问题的算法,提高数据中心、芯片设计和AI训练的效率。