@DanKornas: GPU 工程学领域过于广泛,无法通过零散标签学习。Awesome GPU Engineering 是一个精心整理的 GitHub 资源列表,涵盖……
摘要
一个精心整理的 GitHub 资源列表,用于学习 GPU 工程学,涵盖架构、内核编程、优化、分布式系统及 AI 加速,包括书籍、框架、分析工具和面试准备内容。
查看缓存全文
缓存时间: 2026/06/29 00:21
GPU 工程涵盖范围太广,无法通过随意浏览标签来学习。
Awesome GPU Engineering 是一个精选的 GitHub 资源列表,用于学习 GPU 工程,涵盖架构、内核编程、优化、分布式系统和 AI 加速。
它通过将书籍、框架、性能分析器、系统工具、课程、论文和面试主题分组到一个便于浏览的位置,帮助你构建更清晰的学习路线图。
主要特点:
• 学习路径覆盖 – 从《Programming Massively Parallel Processors》和《CUDA by Example》等基础书籍开始 • 框架地图 – 链接到 CUDA、ROCm、OpenCL、SYCL/oneAPI、Vulkan Compute、Metal 和 Mojo • 性能工具箱 – 指向 Nsight、CUTLASS、TensorRT、Triton 和 Roofline 模型 • 多 GPU + AI 系统 – 收录了 NCCL、vLLM、Accelerate、TensorRT-LLM、Horovod、DeepSpeed 和 Megatron-LM • 学习资料 + 面试准备 – 包括课程、论文、学习工具和 GPU 系统设计主题
它是开源的(CC BY 4.0 许可协议)。
链接在回复中。
相似文章
@vivekgalatage:我发现的最好的GPU优化结构化参考资料——450篇论文,14年研究。一些技术已经进化……
一条推文分享了一个涵盖14年、450篇论文的GPU优化结构化参考资料,指出虽然一些技术已经发展,但心智模型仍然有用。还提到了Onur Mutlu关于GPU架构的讲座。
@pauliusztin_: 我刚找到了理解 GPU 最实用的资源之一。再也不用在不同文档、PDF 和论坛帖子之间跳来跳去了…
Modal Labs 发布了一个开源的 GPU 术语词典,将零散的 NVIDIA 文档、CUDA 细节及编译器参数整合为单一的可导航资源,旨在帮助工程师优化 LLM 的训练与推理。
@chessMan786:GPU架构基础
一条推文分享了一篇关于GPU架构基础的文章链接。
@neural_avb: 今日发现 "GPU Mode" 他们有一个YouTube系列来学习CUDA。还有一个GitHub仓库包含幻灯片/笔记本。一些讲座是…
GPU Mode 是一个学习资源,包含YouTube系列、GitHub仓库(含幻灯片/笔记本)以及一个类似Leetcode的练习网站,用于掌握CUDA编程。
@mdancho84: 重大消息:谷歌刚刚推出了GPU大师课程 100%免费获取:
谷歌发布了关于GPU的免费大师课程,涵盖GPU架构和深度学习加速。