machine-learning-tutorial

标签

Cards List
#machine-learning-tutorial

什么是 MDP?我们该如何求解?

ML at Berkeley · 2021-02-23 缓存

本文通过一个关于大学生日常决策的教学示例,解释了马尔可夫决策过程(MDP)的基础知识,这是深度强化学习中的核心框架。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈