从围棋到生物学及更远：AlphaGo 影响的十年

Google DeepMind Blog 2026/03/09 13:52 新闻

alphago deepmind ai-history reinforcement-learning agi anniversary

摘要

DeepMind 回顾 AlphaGo 诞生十周年，强调其在开启现代 AI 时代中的关键作用，以及它对科学研究和通用人工智能（AGI）探索的深远影响。

AlphaGo 问世已十年，我们在此探讨它如何催化科学发现，并为通往 AGI 的道路铺就基石。

查看原文

查看缓存全文

缓存时间: 2026/05/08 09:12

# 从游戏到生物学及更远：AlphaGo 十年的影响来源：https://deepmind.google/blog/10-years-of-alphago/ 十年前，我们的 AI 系统 AlphaGo 成为首个在复杂围棋游戏中击败世界冠军的程序——比许多专家预期的时间提前了十年，达到了该领域的里程碑。这一成就宣告了如今公认的现代人工智能（AI）时代的开端。凭借一着充满创意的妙手，著名的"第 37 手"（https://deepmind.google/research/alphago/），AlphaGo 展示了 AI 的潜力，并向世人表明，我们已经掌握了开始解决真实世界科学问题的技术。如今，这一突破继续指导着我们构建通向通用人工智能（AGI）系统的道路。我们相信 AGI 将是有史以来最深刻的技术发明，也可能是推动科学、医学和生产力进步的最有力工具。 ## 创意的火花 2016 年，超过 2 亿人观看了 AlphaGo 与世界冠军棋手李世石在首尔的对决。这场比赛因第二局的"第 37 手"而载入史册——一着如此 unconventional 的妙手，职业解说员起初以为是个失误。但它证明是决定性的。约一百手之后，这枚棋子恰好处于让 AlphaGo 获胜的关键位置。这展示了惊人的远见，以及 AI 系统超越模仿人类专家、发现全新策略的能力。围棋长期以来一直是 AI 研究的试金石，因为这项游戏的复杂程度极高。棋盘上的可能位置多达 10^170 种——远远超过可观测宇宙中的原子数量。为了让游戏变得可处理，AlphaGo 结合了深度神经网络与高级搜索和强化学习——这是 DeepMind 开创的一种 AI 方法（https://www.nature.com/articles/nature16961）。 AlphaGo 首先通过学习人类专家的对局来掌握合理的围棋下法，然后自我对弈数十万盘，在不断强化最强获胜策略的过程中持续提升。随后系统只考虑最有潜力的路径，并从这一较小的选点范围内，找到最可能导向胜利的一手。在 AlphaGo 之后，我们构建了 AlphaGo Zero（https://deepmind.google/blog/alphago-zero-starting-from-scratch/），它从完全随机的对弈中学习，成为 arguably 历史上最强的棋手。接着我们进一步泛化系统，推出了 AlphaZero（https://deepmind.google/blog/alphazero-shedding-new-light-on-chess-shogi-and-go/），它从零开始自学掌握任何双人完全信息游戏，包括围棋、国际象棋和将棋。除了游戏规则外没有任何先验知识，AlphaZero 能够在数小时内学会精通国际象棋，并击败不仅包括顶尖人类棋手，还有当时最好的专业象棋程序如 Stockfish。尽管国际象棋已被这些程序大量分析，但正如在围棋中一样，AlphaZero 仍然能够想出有趣的全新策略（https://www.newinchess.com/game-changer）。这进一步证明了我俩在首尔赢得比赛那一刻就知道的事情——这项技术已经准备好应用于我们的真正目标：加速科学突破。 > 我相信 AlphaGo 提供的最大启示是对 AI 时代的决定性预演——证明它不是某种遥远、模糊的未来，而是正在抵达我们 doorstep 的现实。它充当了"来自未来的路线图"，向人类发出了世界即将如何改变的清晰信号。 **围棋大师李世石** **UNIST 客座教授** ## 催化科学突破通过证明它能够驾驭围棋棋盘上的巨大搜索空间，AlphaGo 展示了 AI 帮助我们更好理解物理世界巨大复杂性的潜力。我们从尝试解决蛋白质折叠问题开始，这是一个 50 年的重大挑战：预测蛋白质的 3D 结构——这些信息对于理解疾病和开发新药至关重要。 2020 年，我们最终用 AlphaFold 2 系统（https://deepmind.google/blog/alphafold-five-years-of-impact/）破解了这一长期存在的科学难题。从此，我们预测了科学界已知的全部 2 亿种蛋白质的结构，并在开源数据库中免费向科学家开放。如今，全球超过 300 万研究人员使用 AlphaFold 数据库（https://alphafold.ebi.ac.uk/）加速他们的重要工作，涵盖从疟疾疫苗到塑料降解酶的各个领域。2024 年，John Jumper 和我代表整个 AlphaFold 团队因领导该项目而被授予诺贝尔化学奖，这是一生的荣幸。自 AlphaGo 获胜以来，我们已将其开创性方法应用于许多其他科学和数学领域，包括： **数学推理：** AlphaGo 架构最直接的继承者，AlphaProof（https://deepmind.google/blog/ai-solves-imo-problems-at-silver-medal-level/）学会了使用语言模型与 AlphaZero 的强化学习和搜索算法相结合来证明形式化数学命题。与 AlphaGeometry 2 一起，它成为首个在国际数学奥林匹克（IMO）上达到奖牌标准（银牌）的系统，证明了 AlphaGo 的方法能够解锁高级数学推理，并为我们最有能力的通用模型奠定了基础。 Gemini，我们最大、最有能力的模型，最近更进一步。其 Deep Think 模式的 advanced 版本在 2025 年 IMO 上达到了金牌标准（https://deepmind.google/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/），使用受 AlphaGo 启发的方法。此后，Deep Think 已被应用于（https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/）科学和工程中更复杂的开放式挑战。 **算法发现：** 正如 AlphaGo 在游戏中搜索最佳着法，我们的编程智能体 AlphaEvolve（https://deepmind.google/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/）探索代码空间以发现更高效的算法。它有自己的"第 37 手"时刻——发现了一种新颖的矩阵乘法方法，这一基础数学运算驱动着几乎所有现代神经网络。AlphaEvolve 目前正在从数据中心优化到量子计算的各种问题上进行测试。 **科学协作：** 我们将 AlphaGo 开创的搜索和推理原理整合到 AI co-scientist（https://research.google/blog/accelerating-scientific-breakthroughs-with-an-ai-co-scientist/）中。通过让智能体"辩论"科学想法和假设，该系统充当能够执行严格思考的协作者，以识别数据中的模式并解决复杂问题。在伦敦帝国理工学院（https://www.imperial.ac.uk/news/261293/googles-ai-co-scientist-could-enhance-research/）的验证研究中，它分析了数十年的文献，并独立得出了与抗菌素耐药性相同的假设，而研究人员花了数年时间开发和实验验证才得到这一假设。我们还使用 AI 来更好地理解基因组（https://deepmind.google/blog/alphagenome-ai-for-better-understanding-the-genome/）、推进聚变能源研究（https://deepmind.google/blog/bringing-ai-to-the-next-generation-of-fusion-energy/）、改进天气预测（https://deepmind.google/science/weathernext/）等等。尽管我们的科学模型令人印象深刻，但它们高度专业化。要实现根本性突破，如创造无限的清洁能源或解决我们今天尚不了解的疾病，我们需要能够发现不同学科领域之间潜在结构和联系的通用 AI 系统，并帮助我们像最优秀的科学家一样提出新的假设。 ## 智能的未来对于一个真正通用的 AI，它需要理解物理世界。我们从一开始就将 Gemini 构建为多模态，使其不仅能理解语言，还能理解音频、视频、图像和代码，以建立世界模型。为了在这些模态之间进行思考和推理，最新的 Gemini 模型使用了一些我们为 AlphaGo 和 AlphaZero 开创的技术。下一代 AI 系统还需要能够调用专业工具。例如，如果模型需要知道蛋白质的结构，它可以使用 AlphaFold。我们认为，Gemini 的世界模型、AlphaGo 的搜索和规划技术，以及专业 AI 工具使用的结合，对 AGI 至关重要。真正的创造力是这种 AGI 系统需要展现的关键能力。"第 37 手"一窥了 AI 跳出框框思考的潜力，但真正的原创发明需要更多。它不仅要能想出新奇的围棋策略，正如 AlphaGo 令人印象深刻地做到的那样，而且要能发明一种像围棋一样深奥、优雅、值得研究的游戏。 AlphaGo 传奇胜利十年后，我们的终极目标已在地平线上显现。首先在"第 37 手"中看到的创意火花，催化了如今正汇聚在一起为 AGI 铺平道路的突破——并 usher in 科学发现的新黄金时代。整整十年后，我们回顾这场点燃现代 AI 革命的比赛。 ### AlphaGo ### 与 AlphaGo 和中国顶尖棋手一起探索围棋的奥秘 ### AlphaGo 的创新 ### AlphaGo 的下一步

从围棋到生物学及更远：AlphaGo 影响的十年

相似文章

10 years of AlphaGo: The turning point for AI | Thore Graepel & Pushmeet Kohli

十年历程

@GoogleDeepMind：算法几乎存在于生活的方方面面，从自然世界的物理规律到规划航运路线……

@ericjang11: 在过去的几个月里，我一直在从零实现AlphaGo，这是2016年的一项AI突破，它启发了我……

AI 领域最重大的事件是什么？

提交意见反馈