hopper

标签

Cards List
#hopper

关于在Hopper上使DeepSeek V4 Flash达到近200 tok/s的一些技巧

Reddit r/LocalLLaMA · 2026-06-08 缓存

这篇博文提供了在双GH200工作站上使用vLLM对DeepSeek V4 Flash进行推理,达到近200令牌/秒的技巧和基准测试,重点介绍了使用Canada-Quant的量化检查点和张量并行优化。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈