@kazukifujii: 技术博客发布日5 这是系列博客的第一篇,从基础开始讲解CUDA编程,以…

X AI KOLs Timeline 工具

摘要

Kazuki Fujii 宣布发布CUDA编程基础系列博客的第一篇,以通俗易懂的方式撰写,对于理解FlashAttention和硬件感知加速技术至关重要。

技术博客发布日5 这是系列博客的第一篇,从基础开始讲解CUDA编程,这对于理解或提出FlashAttention或最新的硬件感知加速技术至关重要。这篇博客超过30000字,但我以非常通俗易懂的方式撰写,敬请阅读。 CUDA编程指南第1部分|Kazuki Fujii
查看原文
查看缓存全文

缓存时间: 2026/06/05 13:15

技术博客发布第5天

这是系列博客的第一篇,从基础开始讲解CUDA编程,这对于理解或提出FlashAttention以及近期硬件感知加速技术至关重要。博客全文超过3万字,但我以非常易懂的方式撰写,欢迎阅读。

CUDA编程指南 第一部分 | Kazuki Fujii

Kazuki Fujii (@kazukifujii): テックブログ公開 Day4です。

RLVR(強化学習)時代において欠かすことのできないweight syncの機能についてvLLMがどのようにこれを実現しているのかやさしく解説を行いました。

RLVR時代におけるInference Framework: Weight Syncing編|Kazuki Fujii

相似文章

@snowboat84: https://x.com/snowboat84/status/2061962883651731602

X AI KOLs Timeline

本文是AI工程全景系列的上篇,从历史角度梳理了GPU从游戏显卡到AI加速器的演化、CUDA的豪赌、谷歌TPU的独立路径,以及英伟达为何最终胜出,详细剖析了芯片、供应链、网络、电力等AI基础设施的底层逻辑。