@sheriyuo: 大家期待已久的 Hands-on Modern RL 教程终于以英文PDF形式提供下载链接:https://github.com/walkinglabs/hands-on-modern-rl/releases/tag/v0.1.5…

X AI KOLs Timeline 工具

摘要

一门开源、动手实践的现代强化学习课程,内容涵盖从经典控制到LLM后训练、RLHF、DPO、GRPO以及agentic RL,现提供免费英文PDF下载。

大家期待已久的 Hands-on Modern RL 教程终于以英文PDF形式提供下载链接:https://github.com/walkinglabs/hands-on-modern-rl/releases/tag/v0.1.5…
查看原文
查看缓存全文

缓存时间: 2026/05/15 13:01

动手实践现代强化学习

一门动手实践的现代强化学习课程

以实践为先导的现代强化学习指南,涵盖从经典控制到LLM后训练、RLVR及多模态智能体。

英文 · 中文

微信群

课程预览 · 概览 · 新闻 · 目录 · 课程大纲 · 实验代码 · 快速开始 · 贡献

相似文章