标签
ExecuTorch 现有一个 MLX 委托,可在 Apple Silicon Mac 上为 PyTorch 模型提供 GPU 加速推理,支持大语言模型、语音转文字以及通过 TorchAO 进行量化的 MoE 模型。
ExecuTorch,PyTorch的设备端AI部署框架,在MLSysConf 2026上获得了最佳行业论文奖。该论文提出了一种统一的解决方案,可在从微控制器到SoC的各种硬件上运行模型。
本文介绍了 ExecuTorch,这是一个原生的 PyTorch 部署框架,旨在无需模型转换或重新实现,即可在多样化的边缘设备上运行 AI 模型。