@DanKornas: GPU 工程学领域过于广泛,无法通过零散标签学习。Awesome GPU Engineering 是一个精心整理的 GitHub 资源列表,涵盖……

X AI KOLs Timeline 工具

摘要

一个精心整理的 GitHub 资源列表,用于学习 GPU 工程学,涵盖架构、内核编程、优化、分布式系统及 AI 加速,包括书籍、框架、分析工具和面试准备内容。

GPU 工程学领域过于广泛,无法通过零散标签学习。 Awesome GPU Engineering 是一个精心整理的 GitHub 资源列表,帮助学习 GPU 工程学,涵盖架构、内核编程、优化、分布式系统及 AI 加速。 它通过将书籍、框架、分析工具、系统工具、课程、论文和面试主题整合在一个便于浏览的地方,帮助你构建更清晰的学习路径。 主要特点: • 学习路径覆盖 – 从基础书籍开始,如《Programming Massively Parallel Processors》和《CUDA by Example》 • 框架映射 – 提供 CUDA、ROCm、OpenCL、SYCL / oneAPI、Vulkan Compute、Metal 和 Mojo 的链接 • 性能工具箱 – 指向 Nsight、CUTLASS、TensorRT、Triton 和 Roofline Model • 多 GPU + AI 系统 – 收集 NCCL、vLLM、Accelerate、TensorRT-LLM、Horovod、DeepSpeed 和 Megatron-LM • 学习资料 + 面试准备 – 包含课程、论文、学习工具和 GPU 系统设计主题 该项目为开源(CC BY 4.0 许可证)。 链接见回复。
查看原文
查看缓存全文

缓存时间: 2026/06/29 00:21

GPU 工程涵盖范围太广,无法通过随意浏览标签来学习。

Awesome GPU Engineering 是一个精选的 GitHub 资源列表,用于学习 GPU 工程,涵盖架构、内核编程、优化、分布式系统和 AI 加速。

它通过将书籍、框架、性能分析器、系统工具、课程、论文和面试主题分组到一个便于浏览的位置,帮助你构建更清晰的学习路线图。

主要特点:

• 学习路径覆盖 – 从《Programming Massively Parallel Processors》和《CUDA by Example》等基础书籍开始 • 框架地图 – 链接到 CUDA、ROCm、OpenCL、SYCL/oneAPI、Vulkan Compute、Metal 和 Mojo • 性能工具箱 – 指向 Nsight、CUTLASS、TensorRT、Triton 和 Roofline 模型 • 多 GPU + AI 系统 – 收录了 NCCL、vLLM、Accelerate、TensorRT-LLM、Horovod、DeepSpeed 和 Megatron-LM • 学习资料 + 面试准备 – 包括课程、论文、学习工具和 GPU 系统设计主题

它是开源的(CC BY 4.0 许可协议)。

链接在回复中。

相似文章