nvidia-h200

#nvidia-h200

@rohanpaul_ai: 我不得不亲自测试才相信这难以置信的推理速度。单个用户使用标准数据中心 GPU 达到 3000 tokens/s。…

X AI KOLs Following ↗ · 2026-05-29 缓存

Kog AI 在 8 块 AMD MI300X GPU 上实现了 3000 tokens/s 的推理速度，在 8 块 NVIDIA H200 上达到 2100 tokens/s，利用了 GPU 令牌生成中隐藏的效率差距。

0 人收藏 0 人点赞

#nvidia-h200

X AI KOLs Timeline ↗ · 2026-05-14

特朗普和习近平会谈，美国允许阿里巴巴、字节跳动、腾讯、京东等10家中国企业购买英伟达H200芯片，未提及台湾问题。马斯克、库克和黄仁勋对会议表示积极评价。

0 人收藏 0 人点赞

#nvidia-h200

Reddit r/LocalLLaMA ↗ · 2026-05-13 缓存

本文提供了一份实用指南，介绍如何微调 TranslateGemma-4B 模型以提升英语与威尔士语之间的双向翻译质量，详细阐述了数据策略、在 NVIDIA H200 GPU 上的 LoRA 训练流程以及通过 GGUF 格式的部署方法。

0 人收藏 0 人点赞