@sheriyuo: 大家期待已久的 Hands-on Modern RL 教程终于以英文PDF形式提供下载链接:https://github.com/walkinglabs/hands-on-modern-rl/releases/tag/v0.1.5…
摘要
一门开源、动手实践的现代强化学习课程,内容涵盖从经典控制到LLM后训练、RLHF、DPO、GRPO以及agentic RL,现提供免费英文PDF下载。
大家期待已久的 Hands-on Modern RL 教程终于以英文PDF形式提供下载链接:https://github.com/walkinglabs/hands-on-modern-rl/releases/tag/v0.1.5…
查看缓存全文
缓存时间: 2026/05/15 13:01
动手实践现代强化学习
一门动手实践的现代强化学习课程
以实践为先导的现代强化学习指南,涵盖从经典控制到LLM后训练、RLVR及多模态智能体。
英文 · 中文
微信群
课程预览 · 概览 · 新闻 · 目录 · 课程大纲 · 实验代码 · 快速开始 · 贡献
相似文章
@yuwen_lu_: 看了一半,我靠怎么从来没人告诉我rl这么好玩
Sanbu 散步发布了现代RL教程Hands-On Modern RL,涵盖从CartPole+PPO入门到LLM后训练(RLHF、DPO、GRPO)和Agentic RL,代码先行,英文版即将更新。
@tom_doerr: Hugging Face深度强化学习课程含实践练习 https://github.com/huggingface/deep-rl-class…
Hugging Face提供了一门含实践练习的深度强化学习课程,目前处于低维护状态,但仍然是学习理论和实践DRL的有用资源。
@syuggupta: 从零开始学习RL的最佳资源
一条推荐'Hands-on Modern RL'网站作为从零开始学习强化学习的最佳资源的推文,并附有关于BipedalWalker章节的链接。
@_rohit_tiwari_: 强化学习课程 结构化学习路径,理解和应用强化学习。https://github.com/upb-lea/reinfor…
一门结构化的强化学习课程,包含讲义、教程任务和视频,作为帕德博恩大学和锡根大学的开源材料分享。
@SergioPaniego:如果你想在周末读点长文 ↓↓↓ @adithya_s_k 撰写的强化学习环境终极指南 https://hug…
本文由 AdithyaSK 在 Hugging Face Space 上发布,分享了在大型语言模型(LLM)时代构建和扩展强化学习环境的全面指南。