alphago

#alphago

@ickma2311: David Silver RL Course (Lecture 8): 整合学习与规划 AlphaGo是整合学习的优美示例…

X AI KOLs Timeline ↗ · 2026-05-16 缓存

David Silver强化学习课程第8讲关于整合学习与规划的摘要，涵盖基于模型的强化学习以及AlphaGo使用策略网络和价值网络结合蒙特卡洛树搜索的方法。

0 人收藏 0 人点赞

#alphago

太棒了。说真的，人们对这个平台很苛刻，但如果你小心选择关注的人，它就是一个持续的……

X AI KOLs Timeline ↗ · 2026-05-16 缓存

Eric Jang 宣布他一直在从头实现 AlphaGo，这个 2016 年的 AI 突破曾激励他进入深度学习领域。

0 人收藏 0 人点赞

#alphago

@neural_avb：这就是经过5-6小时自对弈强化学习训练所能达到的效果——智能体通过激光雷达查看弹丸…

X AI KOLs Timeline ↗ · 2026-05-16 缓存

一个帖子分享了在Unity中使用激光雷达和PPO进行自对弈RL训练的视频，随后是关于从零构建AlphaGo的讲座。

0 人收藏 0 人点赞

#alphago

@enoch4306: 你绝不能错过！！用AI从零开始构建AlphaGo教程。中文字幕 http://pan.quark.cn/s/06bd1030d137 .

X AI KOLs Timeline ↗ · 2026-05-16 缓存

推荐一个从零开始构建AlphaGo的中文字幕教程，适合学习AI和强化学习。

0 人收藏 0 人点赞

#alphago

@Michaelzsguo: 这是我最近看到的关于强化学习基础，以及它和现代 AI 关系的最好深度讨论之一。 Eric Jang 和 Dwarkesh 把一个看起来有点复古的练习，也就是用今天的工具重新构建 AlphaGo，变成了一堂非常清晰的大师课：为什么“搜索 +…

X AI KOLs Timeline ↗ · 2026-05-15 缓存

A detailed discussion on reinforcement learning and its connection to modern AI, using the reconstruction of AlphaGo with modern tools as a clear example of search and self-play. Key takeaways include neural network amortization of search, credit assignment challenges in LLMs vs AlphaGo, and implications for automated research.

0 人收藏 0 人点赞

#alphago