8-16张MI50上Minimax M3模型,峰值吞吐量19 tps

Reddit r/LocalLLaMA 新闻

摘要

报告在8-16张MI50 GPU上运行的Minimax M3模型达到每秒19个token的峰值吞吐量。

暂无内容
查看原文

相似文章