@natolambert: 又一场快速讲座——很多人多次问过我关于我书籍的前置知识和应该了解的内容,所以我制作了一个小讲座…
摘要
Nathan Lambert 分享了一段视频讲座,涵盖了他书籍的前置知识,包括语言模型基础、概率和训练流程,使用 GLM 5.2 进行讲解。
查看缓存全文
缓存时间: 2026/06/25 09:15
又一场快速讲座——很多人问过我关于我这本书的前置知识及需要了解的内容,所以用GLM 5.2做了一场小讲座,覆盖一些更基础的知识。
主题包括:
00:00 引言与课程前置知识
01:37 语言模型概述
02:47 LM头(语言模型头部)
04:29 Softmax与对数概率
06:13 LM训练样本剖析
06:37 计算LLM概率(+小狗Phoebe)
09:52 训练后阶段的三种常见掩码
11:03 小解码回顾
12:14 训练LM:交叉熵
13:23 优化与微调
13:55 预训练到中间训练再到SFT的流程
15:25 概率基础:KL散度与熵
19:36 Sigmoid与成对似然
20:29 强化学习框架(MDP)
22:28 将工具过渡到训练后阶段
23:12 推荐资源与总结
祝学习愉快,我仍在收集课程期间的提问,用于制作问答视频。
相似文章
@natolambert: 为新书增加的新讲座!名义上是关于合成数据,但主要是对蒸馏文献的回顾,从……
Natolambert 宣布了一场新讲座,内容涵盖合成数据和蒸馏的历史,从 Hinton 2015 年的论文到现代的 on-policy 蒸馏,视频总时长超过 7 小时。
@natolambert: 新播客与@finbarrtimbers!我们盘点最新的后训练配方,从GLM 5.1、Kimi K2.6、DeepSeek V4、Xia…
Nathan Lambert和Finbarr Timbers讨论了大型语言模型的最新后训练配方,包括DeepSeek V4、GLM 5.1、Kimi K2.6,以及行业向多教师在线策略蒸馏的转变。
@natolambert: 我的RLHF书籍的目标是为下一代学习后训练打造一个“互联网上的家园”。这就是…
Nathan Lambert宣布他的目标是创建一个学习RLHF后训练的综合枢纽,包括书籍、讲座、代码和社区资源。
@phosphenq:Andrej Karpathy 这段 2 小时视频,比今年你刷过的所有 AI 教程加起来还管用
OpenAI 联合创始人 Andrej Karpathy 发布了一段 2 小时教学视频,承诺让观众大幅提升大语言模型的实战能力。
@stanfordnlp: 很多人大概知道 Transformer 是如何工作的。要真正理解现代神经语言模型——MoE、GPU 分块、算子内核、RLHF、数据——你需要修读 CS336
斯坦福 CS336 课程探讨现代神经语言模型,涵盖 MoE 和 RLHF 等主题,现已在 YouTube 发布,延迟约两周。