alphago

标签

Cards List
#alphago

@ickma2311: David Silver RL Course (Lecture 8): 整合学习与规划 AlphaGo是整合学习的优美示例…

X AI KOLs Timeline · 2026-05-16 缓存

David Silver强化学习课程第8讲关于整合学习与规划的摘要,涵盖基于模型的强化学习以及AlphaGo使用策略网络和价值网络结合蒙特卡洛树搜索的方法。

0 人收藏 0 人点赞
#alphago

太棒了。说真的,人们对这个平台很苛刻,但如果你小心选择关注的人,它就是一个持续的……

X AI KOLs Timeline · 2026-05-16 缓存

Eric Jang 宣布他一直在从头实现 AlphaGo,这个 2016 年的 AI 突破曾激励他进入深度学习领域。

0 人收藏 0 人点赞
#alphago

@neural_avb:这就是经过5-6小时自对弈强化学习训练所能达到的效果——智能体通过激光雷达查看弹丸…

X AI KOLs Timeline · 2026-05-16 缓存

一个帖子分享了在Unity中使用激光雷达和PPO进行自对弈RL训练的视频,随后是关于从零构建AlphaGo的讲座。

0 人收藏 0 人点赞
#alphago

@enoch4306: 你绝不能错过!! 用AI从零开始构建AlphaGo教程。 中文字幕 http://pan.quark.cn/s/06bd1030d137 .

X AI KOLs Timeline · 2026-05-16 缓存

推荐一个从零开始构建AlphaGo的中文字幕教程,适合学习AI和强化学习。

0 人收藏 0 人点赞
#alphago

@Michaelzsguo: 这是我最近看到的关于强化学习基础,以及它和现代 AI 关系的最好深度讨论之一。 Eric Jang 和 Dwarkesh 把一个看起来有点复古的练习,也就是用今天的工具重新构建 AlphaGo,变成了一堂非常清晰的大师课:为什么“搜索 +…

X AI KOLs Timeline · 2026-05-15 缓存

A detailed discussion on reinforcement learning and its connection to modern AI, using the reconstruction of AlphaGo with modern tools as a clear example of search and self-play. Key takeaways include neural network amortization of search, credit assignment challenges in LLMs vs AlphaGo, and implications for automated research.

0 人收藏 0 人点赞
#alphago

@ericjang11: 在过去的几个月里,我一直在从零实现AlphaGo,这是2016年的一项AI突破,它启发了我……

X AI KOLs Following · 2026-05-15 缓存

Eric Jang发布了AutoGo,一个从零实现AlphaGo的教程,包含代码和一个可对弈的机器人,展示了前沿能力现在可以低成本复现。

0 人收藏 0 人点赞
#alphago

@dwarkesh_sp: 与 @ericjang11 的新黑板讲座:他演示了如何用现代AI工具从头构建AlphaGo。一些…

X AI KOLs Timeline · 2026-05-15

Eric Jang的黑板讲座逐步讲解了如何使用现代AI工具从零构建AlphaGo,涵盖了强化学习、蒙特卡洛树搜索、自我对弈,并与LLM训练相联系,同时讨论了自动化AI研究。

0 人收藏 0 人点赞
#alphago

AI 领域最重大的事件是什么?

Reddit r/artificial · 2026-04-22

观点文章认为,AlphaGo 与 ChatGPT 是两次最重要的 AI 突破,其中 ChatGPT 因让 AI 走进大众日常生活而影响力最大。

0 人收藏 0 人点赞
#alphago

从围棋到生物学及更远:AlphaGo 影响的十年

Google DeepMind Blog · 2026-03-09 缓存

DeepMind 回顾 AlphaGo 诞生十周年,强调其在开启现代 AI 时代中的关键作用,以及它对科学研究和通用人工智能(AGI)探索的深远影响。

0 人收藏 0 人点赞
#alphago

10 years of AlphaGo: The turning point for AI | Thore Graepel & Pushmeet Kohli

YouTube AI Channels · 2026-05-08 缓存

本文回顾了AlphaGo在2016年击败李世石的历史,分析了其结合深度学习与搜索的技术原理,以及这一事件对AI发展的深远影响。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈