[x86] AI计算扩展(ACE)规范

Hacker News Top 工具

摘要

x86生态系统咨询小组发布了AI计算扩展(ACE)规范,该规范定义了新的x86指令和寄存器状态,用于加速机器学习工作负载中的矩阵乘法和低精度数据格式。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/06/18 05:47

# AI 计算扩展 (ACE) 规范 – x86 生态系统咨询小组 来源:https://x86ecosystem.org/resource/ai-compute-extensions-ace-specification/ - 2026年6月15日 本文档定义了用于加速计算任务的 x86 扩展,初始重点放在矩阵乘法内核和对机器学习工作负载至关重要的低精度数据格式上。 ACE 扩展定义了矩阵乘法原语,通过以下新功能增强了 AVX 和标量代码: - ACE 寄存器状态,包括磁贴和块缩放寄存器 - 数据运算处理操作,消耗 AVX 寄存器输入并对磁贴寄存器状态进行操作 - 数据移动操作,在 ACE 寄存器状态和 AVX 寄存器之间移动数据 - 系统管理的状态和操作 ACE 在 AVX 向量和 ACE 磁贴寄存器之间提供了紧密集成,将高计算密度的磁贴处理操作与 AVX 的全面数据处理功能相结合。 除了矩阵加速之外,在 AVX10 框架下还提供了一系列专用的格式转换操作。

相似文章

AMD AI ENGAGE

Reddit r/ArtificialInteligence

本文讨论了 AMD AI Engage 计划,这是一个面向 AI 开发者的社区倡议,为构建大语言模型(LLM)应用和生成式 AI 工作流提供奖金、积分以及交流机会。

在Ryzen AI 7 350 NPU上达到峰值TOPS性能

Lobsters Hottest

关于在AMD Ryzen AI 7 350 NPU上实现峰值TOPS性能的技术深度剖析,与Xilinx AIE-ML v2 AI引擎进行比较,并解释用于矩阵乘法工作负载的硬件架构。