@0xSero: Minimax-M3 在 4 块 RTX Pro 6000 上运行 - 800k 上下文 - 4 路并发 (250k) - 70-120 tok/s - 2000 tok/s 预填充无缓存…

X AI KOLs Following 模型

摘要

Minimax-M3 被演示在 4 块 RTX Pro 6000 GPU 上运行,具备 800k 上下文,在 4 路并发下达到 70-120 tok/s 推理速度和 2000 tok/s 预填充速度,使用 376GB VRAM 和 mxfp4 格式。

Minimax-M3 在 4 块 RTX Pro 6000 上运行 - 800k 上下文 - 4 路并发 (250k) - 70-120 tok/s - 2000 tok/s 预填充 (无缓存) - 376GB VRAM - mxfp4 它正在改善我某个视频中的音频,实际上在研究解决方案方面做得不错。 好模型 https://t.co/7QcuzrDnEK
查看原文
查看缓存全文

缓存时间: 2026/06/15 09:00

Minimax-M3 运行在 4 块 RTX Pro 6000 上

  • 800k 上下文
  • 250k 下 4 倍并发
  • 70-120 tok/s
  • 无缓存预填充 2000 tok/s
  • 376GB 显存
  • mxfp4

它正在改善我其中一个视频的音频,在研究解决方案方面做得不错。

好模型 https://t.co/7QcuzrDnEK

相似文章