@NFTCPS: 加州大学这课,搞AI的都给我冲! 理论+实战,把RL和LLM训练从零到一拆成渣。教你MDP、PPO算法、RLHF全流程,还有Jupyter代码实操。UCLA教授主讲,视频+作业都有,学完直接上手。 课程地址:https://ernestr…

X AI KOLs Timeline 事件

摘要

This article recommends a UCLA-led online course on Reinforcement Learning for Large Language Models, covering theory, algorithms like PPO and RLHF, and practical coding exercises.

加州大学这课,搞AI的都给我冲! 理论+实战,把RL和LLM训练从零到一拆成渣。教你MDP、PPO算法、RLHF全流程,还有Jupyter代码实操。UCLA教授主讲,视频+作业都有,学完直接上手。 课程地址:https://ernestryu.com/courses/RL-LLM.html… 别再傻看论文了,这套课能让你真学会RL+LLM训练。不然你连ChatGPT怎么调教出来的都不知道!
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/05/10 10:25

加州大学这课,搞AI的都给我冲! 理论+实战,把RL和LLM训练从零到一拆成渣。教你MDP、PPO算法、RLHF全流程,还有Jupyter代码实操。UCLA教授主讲,视频+作业都有,学完直接上手。 课程地址:https://ernestryu.com/courses/RL-LLM.html… 别再傻看论文了,这套课能让你真学会RL+LLM训练。不然你连ChatGPT怎么调教出来的都不知道!


Reinforcement Learning of Large Language Models

Source: https://ernestryu.com/courses/RL-LLM.html

Lecture slides


Lecture videos



Course Information

Instructor

Ernest K. Ryu Assistant Professor of Mathematics, UCLA, Photo of Ernest Ryu

Prerequisites

Students are expected to have basic familiarity with deep learning at the level of image classification. No prior experience with reinforcement learning (RL) or large language models (LLMs) is assumed. For the deep RL lectures, students should be familiar with conditional expectations and the tower property (law of total expectation).

相似文章

@wsl8297: 加州大学开放课程《大语言模型的强化学习》,用“理论 + 实战”的方式,把 AI 训练的关键技术从零到一讲透,帮你系统建立从强化学习到 LLM 训练的完整框架。 课程内容覆盖全面,配套资源齐全:讲座幻灯片、完整视频、实践练习一应俱全,学完就…

X AI KOLs Timeline

加州大学助理教授Ernest K. Ryu推出《大语言模型的强化学习》开放课程,结合理论与实践全面解析RLHF、PPO/DPO等LLM训练关键技术及配套资源。该课程为开发者与研究者提供了从基础算法到实战部署的系统学习路径。

@NFTCPS: 想学透强化学习?别做梦了兄弟 网课教你调个包,学完还是一脸懵逼。读论文?公式堆成山,直接劝退。系统梳理原理?门槛高得像登天,路径乱得像迷宫。 最近我发现一本开源书《强化学习的数学基础》,直接捅破这层窗户纸。它给你一条清清楚楚的路线:从数学…

X AI KOLs Timeline

Introduces an open-source book 'Mathematical Foundation of Reinforcement Learning' that provides a rigorous yet accessible mathematical approach to RL, using grid world examples to clarify algorithmic logic.