@stanfordnlp: 很多人大概知道 Transformer 是如何工作的。要真正理解现代神经语言模型——MoE、GPU 分块、算子内核、RLHF、数据——你需要修读 CS336
摘要
斯坦福 CS336 课程探讨现代神经语言模型,涵盖 MoE 和 RLHF 等主题,现已在 YouTube 发布,延迟约两周。
查看缓存全文
缓存时间: 2026/05/13 00:32
很多人对 Transformer 的工作原理有一个大概的了解。要真正理解现代神经语言模型——包括混合专家模型(MoE)、GPU 分块技术、算子内核(kernels)、人类反馈强化学习(RLHF)以及数据——你需要学习由 @tatsu_hashimoto 和 @percyliang 主讲的 CS336 课程。2026 年的版本会在 YouTube 上延迟约两周上线:http://youtube.com/playlist?list=PLoROMvodv4rMqXOcazWaTUHhq-yembLCV… 课程资料:https://cs336.stanford.edu
@stanfordnlp:很多人对 Transformer 的工作原理有一个大概的了解。要真正理解现代神经语言模型——包括混合专家模型(MoE)、GPU 分块技术、算子内核、人类反馈强化学习(RLHF)以及数据——…
频道: @stanfordnlp 来源:https://www.youtube.com/playlist?list=PLoROMvodv4rMqXOcazWaTUHhq-yembLCV
相似文章
@DanKornas: "斯坦福CS229 I 机器学习 I 构建大型语言模型(LLMs)"(斯坦福在线)... 你将学到:…
斯坦福CS229在线课程公告,涵盖构建大型语言模型、深度神经网络、TensorFlow、Keras、OpenCV以及使用spaCy的自然语言处理。
@Rassh_RAJ: 斯坦福CS336: Large Language Models from Scratch (2026) 现已完整上传至YouTube,相比2025版新增了一些内容…
斯坦福大学CS336课程《Large Language Models from Scratch》(2026)现已完整上线YouTube,在2025年播放列表基础上有所扩充,提供超越API调用的LLM深入理解。
@stanfordnlp: CS336的“问题”不在于大约22小时的视频,而在于完成作业所需的大量时间。…
斯坦福大学的CS336课程宣布开课,从零开始教授语言建模,包含密集的实践作业,涵盖分词器、Transformer、数据和对齐。
@stanfordnlp:学习成功训练最先进语言模型的细节(即“技巧”或“秘诀”)有两条路径……
斯坦福NLP将CS336课程推广为学习成功训练最先进语言模型技巧的途径。
@techNmak:这个周末来斯坦福学LLM吧。斯坦福2025秋季的Transformers与LLMs课程完全公开且完全免费。…
斯坦福大学2025年秋季的Transformers与LLMs课程完全公开且免费,涵盖Transformer基础、高级技术、LLM训练、推理优化等9场讲座。