标签
FlashLib 更新,支持基于 IVF-Flat 的 ANN 搜索,在真实向量工作负载上性能比 cuVS 最高提升 6.5 倍。LEANN 现已集成 FlashLib 作为后端,在构建和搜索操作中带来显著加速。
Flash-KMeans 团队发布了 FlashLib,这是一个面向经典机器学习算子的 GPU 库,在 Hopper GPU 上相比 cuML 可实现高达 208 倍的加速,专注于为智能体 AI 工作负载提供快速、可预测的性能。