@__tinygrad__: 我们已凭借AMD MI350X训练Llama 8B登上MLPerf榜单。这基于我们自己的驱动、运行时、内核及训练循环…

X AI KOLs Timeline 新闻

摘要

tinygrad宣布,其凭借AMD MI350X硬件训练Llama 8B,在MLPerf基准测试榜单上占据一席之地,采用了自研驱动、运行时、内核及训练循环,并计划进一步优化时间并挑战405B模型。

我们已凭借AMD MI350X训练Llama 8B登上MLPerf榜单。这基于我们自己的驱动、运行时、内核及训练循环。下一个MLPerf目标为405B,同时提升8B的训练时间(tinygrad目前用时170分钟)。https://t.co/syPwte872y
查看原文
查看缓存全文

缓存时间: 2026/06/16 21:41

我们正在用AMD MI350X训练Llama 8B,并登上了MLPerf榜单。这是基于我们自研的驱动、运行时、内核和训练循环。下一轮MLPerf将挑战405B模型,同时优化8B的训练时间(tinygrad目前为170分钟)。https://t.co/syPwte872y

相似文章

llama.cpp B9387 重大 AMD/ROCm PP 更新

Reddit r/LocalLLaMA

llama.cpp 版本 b9387 引入了对 AMD CDNA 架构(MI100、MI200、MI300 系列)的 MFMA 支持,提升了数据中心 AMD GPU 上的处理流程性能。