从围棋到生物学及更远:AlphaGo 影响的十年

Google DeepMind Blog 新闻

摘要

DeepMind 回顾 AlphaGo 诞生十周年,强调其在开启现代 AI 时代中的关键作用,以及它对科学研究和通用人工智能(AGI)探索的深远影响。

AlphaGo 问世已十年,我们在此探讨它如何催化科学发现,并为通往 AGI 的道路铺就基石。
查看原文
查看缓存全文

缓存时间: 2026/05/08 09:12

# 从游戏到生物学及更远:AlphaGo 十年的影响 来源:https://deepmind.google/blog/10-years-of-alphago/ 十年前,我们的 AI 系统 AlphaGo 成为首个在复杂围棋游戏中击败世界冠军的程序——比许多专家预期的时间提前了十年,达到了该领域的里程碑。 这一成就宣告了如今公认的现代人工智能(AI)时代的开端。凭借一着充满创意的妙手,著名的"第 37 手"(https://deepmind.google/research/alphago/),AlphaGo 展示了 AI 的潜力,并向世人表明,我们已经掌握了开始解决真实世界科学问题的技术。 如今,这一突破继续指导着我们构建通向通用人工智能(AGI)系统的道路。我们相信 AGI 将是有史以来最深刻的技术发明,也可能是推动科学、医学和生产力进步的最有力工具。 ## 创意的火花 2016 年,超过 2 亿人观看了 AlphaGo 与世界冠军棋手李世石在首尔的对决。这场比赛因第二局的"第 37 手"而载入史册——一着如此 unconventional 的妙手,职业解说员起初以为是个失误。但它证明是决定性的。约一百手之后,这枚棋子恰好处于让 AlphaGo 获胜的关键位置。这展示了惊人的远见,以及 AI 系统超越模仿人类专家、发现全新策略的能力。 围棋长期以来一直是 AI 研究的试金石,因为这项游戏的复杂程度极高。棋盘上的可能位置多达 10^170 种——远远超过可观测宇宙中的原子数量。 为了让游戏变得可处理,AlphaGo 结合了深度神经网络与高级搜索和强化学习——这是 DeepMind 开创的一种 AI 方法(https://www.nature.com/articles/nature16961)。 AlphaGo 首先通过学习人类专家的对局来掌握合理的围棋下法,然后自我对弈数十万盘,在不断强化最强获胜策略的过程中持续提升。随后系统只考虑最有潜力的路径,并从这一较小的选点范围内,找到最可能导向胜利的一手。 在 AlphaGo 之后,我们构建了 AlphaGo Zero(https://deepmind.google/blog/alphago-zero-starting-from-scratch/),它从完全随机的对弈中学习,成为 arguably 历史上最强的棋手。接着我们进一步泛化系统,推出了 AlphaZero(https://deepmind.google/blog/alphazero-shedding-new-light-on-chess-shogi-and-go/),它从零开始自学掌握任何双人完全信息游戏,包括围棋、国际象棋和将棋。除了游戏规则外没有任何先验知识,AlphaZero 能够在数小时内学会精通国际象棋,并击败不仅包括顶尖人类棋手,还有当时最好的专业象棋程序如 Stockfish。尽管国际象棋已被这些程序大量分析,但正如在围棋中一样,AlphaZero 仍然能够想出有趣的全新策略(https://www.newinchess.com/game-changer)。 这进一步证明了我俩在首尔赢得比赛那一刻就知道的事情——这项技术已经准备好应用于我们的真正目标:加速科学突破。 > 我相信 AlphaGo 提供的最大启示是对 AI 时代的决定性预演——证明它不是某种遥远、模糊的未来,而是正在抵达我们 doorstep 的现实。它充当了"来自未来的路线图",向人类发出了世界即将如何改变的清晰信号。 **围棋大师 李世石** **UNIST 客座教授** ## 催化科学突破 通过证明它能够驾驭围棋棋盘上的巨大搜索空间,AlphaGo 展示了 AI 帮助我们更好理解物理世界巨大复杂性的潜力。我们从尝试解决蛋白质折叠问题开始,这是一个 50 年的重大挑战:预测蛋白质的 3D 结构——这些信息对于理解疾病和开发新药至关重要。 2020 年,我们最终用 AlphaFold 2 系统(https://deepmind.google/blog/alphafold-five-years-of-impact/)破解了这一长期存在的科学难题。从此,我们预测了科学界已知的全部 2 亿种蛋白质的结构,并在开源数据库中免费向科学家开放。如今,全球超过 300 万研究人员使用 AlphaFold 数据库(https://alphafold.ebi.ac.uk/)加速他们的重要工作,涵盖从疟疾疫苗到塑料降解酶的各个领域。2024 年,John Jumper 和我代表整个 AlphaFold 团队因领导该项目而被授予诺贝尔化学奖,这是一生的荣幸。 自 AlphaGo 获胜以来,我们已将其开创性方法应用于许多其他科学和数学领域,包括: **数学推理:** AlphaGo 架构最直接的继承者,AlphaProof(https://deepmind.google/blog/ai-solves-imo-problems-at-silver-medal-level/)学会了使用语言模型与 AlphaZero 的强化学习和搜索算法相结合来证明形式化数学命题。与 AlphaGeometry 2 一起,它成为首个在国际数学奥林匹克(IMO)上达到奖牌标准(银牌)的系统,证明了 AlphaGo 的方法能够解锁高级数学推理,并为我们最有能力的通用模型奠定了基础。 Gemini,我们最大、最有能力的模型,最近更进一步。其 Deep Think 模式的 advanced 版本在 2025 年 IMO 上达到了金牌标准(https://deepmind.google/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/),使用受 AlphaGo 启发的方法。此后,Deep Think 已被应用于(https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/)科学和工程中更复杂的开放式挑战。 **算法发现:** 正如 AlphaGo 在游戏中搜索最佳着法,我们的编程智能体 AlphaEvolve(https://deepmind.google/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/)探索代码空间以发现更高效的算法。它有自己的"第 37 手"时刻——发现了一种新颖的矩阵乘法方法,这一基础数学运算驱动着几乎所有现代神经网络。AlphaEvolve 目前正在从数据中心优化到量子计算的各种问题上进行测试。 **科学协作:** 我们将 AlphaGo 开创的搜索和推理原理整合到 AI co-scientist(https://research.google/blog/accelerating-scientific-breakthroughs-with-an-ai-co-scientist/)中。通过让智能体"辩论"科学想法和假设,该系统充当能够执行严格思考的协作者,以识别数据中的模式并解决复杂问题。在伦敦帝国理工学院(https://www.imperial.ac.uk/news/261293/googles-ai-co-scientist-could-enhance-research/)的验证研究中,它分析了数十年的文献,并独立得出了与抗菌素耐药性相同的假设,而研究人员花了数年时间开发和实验验证才得到这一假设。 我们还使用 AI 来更好地理解基因组(https://deepmind.google/blog/alphagenome-ai-for-better-understanding-the-genome/)、推进聚变能源研究(https://deepmind.google/blog/bringing-ai-to-the-next-generation-of-fusion-energy/)、改进天气预测(https://deepmind.google/science/weathernext/)等等。 尽管我们的科学模型令人印象深刻,但它们高度专业化。要实现根本性突破,如创造无限的清洁能源或解决我们今天尚不了解的疾病,我们需要能够发现不同学科领域之间潜在结构和联系的通用 AI 系统,并帮助我们像最优秀的科学家一样提出新的假设。 ## 智能的未来 对于一个真正通用的 AI,它需要理解物理世界。我们从一开始就将 Gemini 构建为多模态,使其不仅能理解语言,还能理解音频、视频、图像和代码,以建立世界模型。 为了在这些模态之间进行思考和推理,最新的 Gemini 模型使用了一些我们为 AlphaGo 和 AlphaZero 开创的技术。 下一代 AI 系统还需要能够调用专业工具。例如,如果模型需要知道蛋白质的结构,它可以使用 AlphaFold。 我们认为,Gemini 的世界模型、AlphaGo 的搜索和规划技术,以及专业 AI 工具使用的结合,对 AGI 至关重要。 真正的创造力是这种 AGI 系统需要展现的关键能力。"第 37 手"一窥了 AI 跳出框框思考的潜力,但真正的原创发明需要更多。它不仅要能想出新奇的围棋策略,正如 AlphaGo 令人印象深刻地做到的那样,而且要能发明一种像围棋一样深奥、优雅、值得研究的游戏。 AlphaGo 传奇胜利十年后,我们的终极目标已在地平线上显现。首先在"第 37 手"中看到的创意火花,催化了如今正汇聚在一起为 AGI 铺平道路的突破——并 usher in 科学发现的新黄金时代。 整整十年后,我们回顾这场点燃现代 AI 革命的比赛。 ### AlphaGo ### 与 AlphaGo 和中国顶尖棋手一起探索围棋的奥秘 ### AlphaGo 的创新 ### AlphaGo 的下一步

相似文章

十年历程

OpenAI Blog

OpenAI 反思其从一小群研究人员发展到领先 AI 公司的十年历程,突出了包括 Dota 1v1、情感神经元、RLHF 工作、ChatGPT 和 GPT-4 在内的关键里程碑,同时强调了其迭代部署策略在负责任地推进 AI 发展中的重要性。

AI 领域最重大的事件是什么?

Reddit r/artificial

观点文章认为,AlphaGo 与 ChatGPT 是两次最重要的 AI 突破,其中 ChatGPT 因让 AI 走进大众日常生活而影响力最大。