@pauliusztin_: 我刚找到了理解 GPU 最实用的资源之一。再也不用在不同文档、PDF 和论坛帖子之间跳来跳去了…
摘要
Modal Labs 发布了一个开源的 GPU 术语词典,将零散的 NVIDIA 文档、CUDA 细节及编译器参数整合为单一的可导航资源,旨在帮助工程师优化 LLM 的训练与推理。
查看缓存全文
缓存时间: 2026/05/09 03:41
我刚刚发现了一个了解 GPU 最有用的资源之一。再也不用在不同文档、PDF 和论坛帖子之间来回跳转了… → https://modal.com/gpu-glossary/readme…
大多数从事 GPU 开发的工程师都会遇到同样的问题: • 概念分散在不同的资料中 • 底层细节与高层抽象无法建立联系 • 最终只能死记硬背术语,却无法真正理解
比如以下这些: • 什么是 Streaming Multiprocessor? • Compute Capability 如何影响你的代码? • nvcc 参数在底层究竟是如何工作的?
因此,@modal 团队构建了一份 GPU Glossary,将所有内容整合在一处。并且它具备以下特点:
- 涵盖完整技术栈
- 专为工程师打造
- 全站链接互通
学习路径非常简单:
- 挑选一个你尚未完全掌握的概念
- 顺着链接跨越整个技术栈深入探索
- 培养直观理解,而非机械记忆术语
如果你正在处理大规模的 LLMs、模型训练或推理任务,这种深度理解至关重要。因为 GPU 的性能瓶颈通常不会直接浮现在表面。
源码仓库地址:https://modal.com/gpu-glossary/readme…
README | GPU Glossary
Source: https://modal.com/gpu-glossary/readme
██████╗ ██████╗ ██╗ ██╗ ██╔════╝ ██╔══██╗██║ ██║ ██║ ███╗██████╔╝██║ ██║ ██║ ██║██╔═══╝ ██║ ██║ ╚██████╔╝██║ ╚██████╔╝ ╚═════╝ ╚═╝ ╚═════╝ ██████╗ ██╗ ██████╗ ███████╗███████╗ █████╗ ██████╗ ██╗ ██╗ ██╔════╝ ██║ ██╔═══██╗██╔════╝██╔════╝██╔══██╗██╔══██╗╚██╗ ██╔╝ ██║ ███╗██║ ██║ ██║███████╗███████╗███████║██████╔╝ ╚████╔╝ ██║ ██║██║ ██║ ██║╚════██║╚════██║██╔══██║██╔══██╗ ╚██╔╝ ╚██████╔╝███████╗╚██████╔╝███████║███████║██║ ██║██║ ██║ ██║ ╚═════╝ ╚══════╝ ╚═════╝ ╚══════╝╚══════╝╚═╝ ╚═╝╚═╝ ╚═╝ ╚═╝
我们编写这份 GPU Glossary,旨在解决我们在 Modal (https://modal.com/) 开发 GPU 应用时遇到的痛点:相关文档过于分散,导致很难将不同技术栈层面的概念串联起来,例如 Streaming Multiprocessor Architecture (https://modal.com/gpu-glossary/device-hardware/streaming-multiprocessor-architecture)、Compute Capability (https://modal.com/gpu-glossary/device-software/compute-capability) 以及 nvcc 编译器参数 (https://modal.com/gpu-glossary/host-software)。
为此,我们查阅了 NVIDIA 的官方 PDF (https://docs.nvidia.com/cuda/pdf/PTX_Writers_Guide_To_Interoperability.pdf),潜水浏览了众多优质的 Discord 社区 (https://discord.gg/gpumode),甚至入手了纸质教科书 (https://www.amazon.com/Professional-CUDA-Programming-John-Cheng/dp/1118739329),最终汇编成这份涵盖整个技术栈的 Glossary。
与传统的 PDF、Discord 聊天记录或书籍不同,这是一份 hypertext document —— 所有页面均相互链接。你可以随时向下跳转到 Warp Scheduler (https://modal.com/gpu-glossary/device-hardware/warp-scheduler) 页面深入了解,从而更好地弄明白你在阅读 CUDA programming model (https://modal.com/gpu-glossary/host-software/cuda-c) 文章时遇到的 threads (https://modal.com/gpu-glossary/device-software/thread) 相关概念。
你也可以按顺序线性阅读。如需在页面间导航,可使用键盘方向键、每页底部的翻页箭头,或者目录(桌面端位于侧边栏,移动端位于汉堡菜单)。
该 Glossary 的源代码已托管于 GitHub (https://github.com/modal-labs/gpu-glossary)。
相似文章
@DanKornas: GPU 工程学领域过于广泛,无法通过零散标签学习。Awesome GPU Engineering 是一个精心整理的 GitHub 资源列表,涵盖……
一个精心整理的 GitHub 资源列表,用于学习 GPU 工程学,涵盖架构、内核编程、优化、分布式系统及 AI 加速,包括书籍、框架、分析工具和面试准备内容。
@vivekgalatage:我发现的最好的GPU优化结构化参考资料——450篇论文,14年研究。一些技术已经进化……
一条推文分享了一个涵盖14年、450篇论文的GPU优化结构化参考资料,指出虽然一些技术已经发展,但心智模型仍然有用。还提到了Onur Mutlu关于GPU架构的讲座。
@0x0SojalSec: 去他妈的付费课程,掌握AI系统的GPU工程。从基础书籍和CUDA/ROCm编程到低阶…
一份精心整理的资源列表,用于掌握AI系统的GPU工程,涵盖CUDA、ROCm、优化工具、多GPU编排和分布式训练。
大规模LLM推理开放手册(GPU内部机制、KV缓存、批处理、vLLM/SGLang/TensorRT-LLM)[P]
一本正在编写中的开放手册,解释LLM推理内部机制,包括GPU内存层次结构、KV缓存、批处理以及vLLM和TensorRT-LLM等流行推理引擎。
@neural_avb: 今日发现 "GPU Mode" 他们有一个YouTube系列来学习CUDA。还有一个GitHub仓库包含幻灯片/笔记本。一些讲座是…
GPU Mode 是一个学习资源,包含YouTube系列、GitHub仓库(含幻灯片/笔记本)以及一个类似Leetcode的练习网站,用于掌握CUDA编程。