kernel-co-design

标签

Cards List
#kernel-co-design

Meta的优化版RecSys推理(58分钟阅读)

TLDR AI · 2026-05-08 缓存

Meta的内核内广播优化(IKBO)通过内核-模型-系统协同设计,消除了RecSys推理中的冗余用户嵌入广播,在H100 GPU上实现了高达2/3的延迟降低和约4倍加速,并成为Meta自适应排名模型的骨干。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈