标签
David Silver强化学习课程第8讲关于整合学习与规划的摘要,涵盖基于模型的强化学习以及AlphaGo使用策略网络和价值网络结合蒙特卡洛树搜索的方法。
NVIDIA与David Silver的Ineffable Intelligence已达成合作,共同构建大规模强化学习的基础设施,专注于即时生成数据并利用NVIDIA下一代平台的管线。