@DanKornas:不要通过零散的教程学习 LLM。LLM from Scratch 是一个面向开发者的实践性 PyTorch 课程,适合那些想要……
摘要
一个实践性 PyTorch 课程,教授从 Transformer 基础到微调和对齐的 LLM 训练,包括 RLHF 和 GRPO。
查看缓存全文
缓存时间: 2026/06/03 07:47
别再从碎片化的教程中学习LLM了。
LLM from Scratch 是一套基于 PyTorch 的实践课程,专为想理解 LLM 如何训练、现代化和对齐的构建者设计。
它通过组织从 Transformer 基础到小模型训练、扩展、微调、奖励建模和 RLHF 的路径,帮助你将概念转化为实现。
核心特点:
• 端到端课程 – 遵循预训练 → 微调 → 对齐的路径,从基础到 RLHF • Transformer 第一性原理 – 涵盖位置编码、自注意力、注意力头、MLP、残差、LayerNorm 和完整块 • 小 LLM 训练循环 – 包含分词、批处理、交叉熵、采样、验证损失和无 Trainer 的训练循环 • 现代架构升级 – 讲解 RMSNorm、RoPE、SwiGLU、KV 缓存、滑动窗口注意力和流式缓存思路 • 包含对齐路径 – 涵盖 SFT、奖励建模、PPO 风格的 RLHF 和 GRPO,并附有具体的训练循环笔记
该课程是开源的(GPL-3.0 许可证)。
链接在回复中。
相似文章
@techNmak: 这是学习LLM工作原理的最佳方式。交互式3D,逐步讲解。涵盖:→ 嵌入 → 层归一化 → 自注意力…
一个交互式3D逐步指南,通过可视化方式学习LLM工作原理,涵盖嵌入、自注意力、softmax等关键Transformer概念。推荐使用视觉化方法,而非阅读论文。
@Dinosn:从零开始构建现代 LLM。每行代码皆有注释。讲解得像给五岁孩子听一样通俗易懂。
一份详尽的12章指南,指导开发者利用全注释代码从零构建现代 LLM,重点讲解注意力机制和 RoPE 等 Transformer 架构基础。
@techNmak: 从零构建LLMs 发现来自Vizuara的宝藏,一个43讲的系列课程,真正兑现了承诺:构建…
Vizuara的43讲系列课程教你如何从零构建LLMs,涵盖Transformer架构、GPT内部原理、分词(BPE)和注意力机制,并提供完整的Python实现。
@rasbt: A little talk on what we can learn from implementing LLM architectures from scratch in Python and PyTorch. And how I ap…
Sebastian Raschka discusses the value of implementing LLM architectures from scratch in Python/PyTorch, sharing his workflow for understanding new open-weight models by dissecting configs, coding, and layer-by-layer debugging.
@_rohit_tiwari_:用PyTorch从头构建类似GPT的LLM > 将LLM架构拆分为简单部分 > 对初学者友好 > Fu…
一个对初学者友好的动手GitHub仓库,将类似GPT的LLM架构拆分为简单部分,包含10个Jupyter笔记本,涵盖分词、注意力机制、Transformer块以及用PyTorch实现的微型GPT。