flash-attention-2

标签

Cards List
#flash-attention-2

有人在他们的 V100 上使用 Flash Attention 2 (ai-bond) 吗?性能如何?

Reddit r/LocalLLaMA · 2026-05-29

一位用户对 Flash Attention 2 的 V100 兼容端口进行了基准测试,报告称相比默认的 PyTorch 注意力机制,速度提升了 3 到 17 倍,内存减少了高达 94%。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈