transformer-deployment

标签

Cards List
#transformer-deployment

Forge-UGC:面向通用图编译器的 FX 优化与寄存器图引擎

Hugging Face Daily Papers · 2026-04-14 缓存

Forge-UGC 是一个四阶段通用图编译器,可在 NPU 上加速 Transformer 部署,相比 OpenVINO/ONNX Runtime,编译时间缩短 6.9–9.2 倍,推理延迟降低 18–36%,能耗减少 30–41%。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈