Gemini 在国际大学生编程竞赛世界总决赛中获得金牌级别成绩

Google DeepMind Blog 新闻

摘要

Gemini 2.5 Deep Think 在 2025 年国际大学生编程竞赛世界总决赛中取得金牌级别成绩,在五小时的竞赛中解决了 12 个问题中的 10 个,展示了抽象推理和问题解决能力的显著进步。

Gemini 2.5 Deep Think 在全球最具声望的计算机编程竞赛中取得突破性成绩,展现了抽象问题解决能力的重大飞跃。
查看原文
查看缓存全文

缓存时间: 2026/04/20 08:35

# Gemini 在国际大学生程序设计竞赛世界总决赛中获得金牌级别成绩 来源: https://deepmind.google/blog/gemini-achieves-gold-medal-level-at-the-international-collegiate-programming-contest-world-finals/ 2025年9月17日 研究 Gemini 2.5 Deep Think 在全球最负盛名的编程竞赛中取得突破性成绩,展现了抽象问题求解能力的飞跃。 Gemini 2.5 Deep Think 的高级版本(https://blog.google/products/gemini/gemini-2-5-deep-think/?utm_source=deepmind.google&utm_medium=referral&utm_campaign=gdm&utm_content=)在 2025 年国际大学生程序设计竞赛(ICPC)世界总决赛(https://worldfinals.icpc.global/)中取得了金牌级别的成绩。 这一里程碑成就紧接着 Gemini 2.5 Deep Think 在国际数学奥林匹克竞赛(IMO)(https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/)中获得金牌仅两个月之后。这些努力中的创新成果将继续被融入到 Gemini Deep Think 的未来版本中,扩展学生和研究人员可获得的先进 AI 能力边界。 在这些竞赛中求解复杂问题需要深层次的抽象推理、创新思维、综合前所未见问题的解决方案的能力,以及真正的聪慧火花。 这两项在竞技编程和数学推理领域的突破共同展现了 Gemini 在抽象问题求解方面的飞跃进步——这是我们朝着通用人工智能(AGI)目标迈进的重要一步。 ## ICPC 设定全球卓越标准 ICPC 是全球公认的历史最悠久、规模最大、最负盛名的大学级别算法编程竞赛。相比高中水平的奥林匹克竞赛(如 IMO),这是一个更高的台阶。每年,来自近 3000 所大学和 103 个以上国家的参赛者参加真实世界编程问题的求解。 今年的世界总决赛于 9 月 4 日在阿塞拜疆巴库举行,汇聚了竞赛早期阶段的顶级队伍。在五小时的时间里,每支队伍都要解决一系列复杂的算法问题。最终排名遵循两个严格的原则:只有完美解答才能获得积分,每一分钟都很关键。在 139 支参赛队伍中,只有前四支队伍获得了金牌(https://worldfinals.icpc.global/scoreboard/2025/finals/index.html)。 ## Gemini 解决了 12 个问题中的 10 个,达到金牌级别 Gemini 2.5 Deep Think 的高级版本在竞赛组织者的指导下,在遵循 ICPC 规则(https://icpc.global/worldfinals/rules)的远程在线环境中进行了实时竞赛。它在人类选手开始后 10 分钟启动,在相同的五小时时间限制内正确解决了 12 个问题中的 10 个,达到了金牌级别的成绩。查看我们的解决方案(https://github.com/google-deepmind/gemini_icpc2025)。 Gemini 仅用 45 分钟内解决了 8 个问题,又用 3 小时内解决了 2 个问题,使用了多种高级数据结构和算法来生成解决方案。通过在总共 677 分钟的时间内解决 10 个问题,如果与竞赛中的大学队伍相比,Gemini 2.5 Deep Think 的排名将是第二位。 ICPC 全球执行主任 Bill Poucher 博士表示:"ICPC 一直致力于设定问题求解的最高标准。Gemini 成功地进入这个舞台并取得了金牌级别的成绩,标志着定义下一代所需的 AI 工具和学术标准的关键时刻。祝贺 Google DeepMind;这项工作将帮助我们促进数字文艺复兴,造福所有人。" 条形图显示了 2025 ICPC 世界总决赛中解决每个 12 个问题所用的时间。Gemini 的时间用蓝色显示,最快大学队伍的时间用灰色显示。 ## Gemini 解决了没有大学队伍解决的问题 在一个前所未有的时刻,我们的模型成功且高效地在前半小时内解决了第 C 问题(https://worldfinals.icpc.global/problems/2025/finals/problems/C-brideofpipestream.pdf)——这是竞赛中没有任何大学队伍解决的问题。 第 C 问题需要找到一个解决方案来通过互相连接的导管网络向一组水箱分配液体,目标是找到这些导管的一种配置,能够尽快填满所有水箱。可能的配置有无穷多种,因为每条导管可能是开的、关的,甚至部分开的,这使得搜索最优配置非常困难。 Gemini 通过一个巧妙的洞察找到了有效的解决方案:它首先假设每个水箱都有一个"优先级值",表示与其他水箱相比,该水箱应该受到多少青睐。给定一组优先级值,可以使用动态规划算法找到导管的最佳配置。Gemini 发现通过应用极小极大定理,原始问题可以通过找到使生成的流最受限的优先级值来解决。利用优先级值与最优流之间的关系,Gemini 使用嵌套三分查找在碗形凸解空间中快速找到最优的优先级值,并解决了第 C 问题。 ## Gemini 的表现汇聚了一系列进步 我们的里程碑成就汇聚了预训练、后训练、新颖强化学习技术、多步推理和并行思考方面的一系列进步。这些创新帮助 Gemini 探索解决复杂问题的不同方法,验证解决方案,并在响应前不断迭代。 例如,在强化学习的过程中,我们训练 Gemini 为编程人员面临的一些最困难的问题进行推理和生成代码,从结果反馈中学习并改进其方法。为了解决一个问题,多个 Gemini 代理各自提出自己的解决方案,使用终端执行代码和测试,然后根据所有尝试迭代解决方案。 我们的内部研究表明,类似版本的 Gemini 2.5 Deep Think 也可以在 2023 年和 2024 年 ICPC 世界总决赛中达到金牌级别的成绩,表现与世界顶级 20 名竞技编程人员不相上下。 > Gemini 成功地进入这个舞台并取得了金牌级别的成绩,标志着定义下一代所需的 AI 工具和学术标准的关键时刻。 Bill Poucher 博士 ICPC 全球执行主任 ## 探索 Gemini 作为协作者的潜力 在 ICPC 上实现金牌级别成绩对软件开发具有即时的实际意义,展示了 AI 可以充当真正的程序员问题求解伙伴。如果将竞赛中最好的 AI 和人类解决方案结合起来,所有 12 个问题都将被完全正确地解决。这展示了 AI 提供独特、新颖的贡献以补充人类专家技能和知识的潜力。 除了数学和编码之外,我们的成就展示了抽象推理中强大的新能力。ICPC 所需的技能——理解复杂问题、制定多步骤逻辑计划并完美执行——与许多科学和工程领域所需的技能相同,例如设计新药物或芯片。这表明 AI 正在从仅仅处理信息转变为实际帮助解决一些世界上最困难的推理问题,这些方式可能造福人类。 拥有 Google AI Ultra 订阅(https://one.google.com/about/google-ai-plans/?utm_source=deepmind.google&utm_medium=referral&utm_campaign=gdm&utm_content=)的 Gemini 用户已经可以在 Gemini 应用(https://gemini.google/?utm_source=deepmind.google&utm_medium=referral&utm_campaign=gdm&utm_content=)中使用轻量级版本的 Gemini 2.5 Deep Think。在不久的将来,更强大的 AI 编码助手可以帮助开发者应对越来越复杂的工程挑战。从物流和调试到科学研究,通过将 AI 用作协作工具,一些最困难、最看似无法解决的问题的解决方案可能很快就将触手可及。 我们感谢国际大学生程序设计竞赛(ICPC)的支持。 这个项目是大规模的协作努力,其成功归功于许多个人和团队的共同努力。Hanzhao(Maggie)Lin 领导了 Gemini 竞技编程和 ICPC 2025 工作的总体技术方向,并与 Heng-Tze Cheng 共同领导总体研究和执行。 ICPC 2025 团队的领导和主要贡献者如下:Chenkai Kuang、Yuan Liu、Zhaoqi Leng、Jieming Mao、Lalit Jain、Chenjie Gu、Goran Žužić、Adams Yu、YaGuang Li、Xiaomeng Yang、Yang Xiao、Adam Zhang、Alex Vitvitskyi、Ashkan Norouzi Fard、Blanca Huergo、Evan Liu、Golnaz Ghiasi、Huan Gui、John Aslanides、Jonathan Lee、Kuba Lacki、Larisa Markeeva、Luheng He、Nigamaa Nayakanti、Nikos Parotsidis、Paul Covington、Petar Veličković、Qijun Tan、Ragha Kotikalapudi、Renshen Wang、Sasan Tavakkol、Shuang Liu、Sidharth Mudgal、Steve Li、Vincent Cohen-Addad、Xianghong Luo、Xinying Song、Yiming Li 和 Zicheng Xu。 用于 ICPC 的高级 Gemini Deep Think 构建在来自 Gemini 后训练、Thinking 和 Coding 领域的联合基础研究之上,包括:Aja Huang、Andreas Kirsch、Ankesh Anand、Archit Sharma、Betty Chan、Chenxi Liu、Cosmo Du、Dawsen Hwang、Dustin Tran、Edward Lockhart、Feryal Behbahani、Fred Zhang、Garrett Bingham、Hao Zhou、Hoang Nguyen、Irene Cai、Jian Li、Jarrod Kahn、Junehyuk Jung、Junsu Kim、Kate Baumli、Kefan Xiao、Le Hou、Lei Yu、Maciej Kula、Mahan Malihi、Marcelo Menegali、Miklós Z. Horváth、Mirek Olšák、Nate Kushman、Pei Sun、Pol Moreno、Rosemary Ke、Sahitya Potluri、Shane Gu、Shubha Raghvendra、Siamak Shakeri、Sid Lall、Steven Zheng、Thang Luong、Theophane Weber、Tong He、Tianhe(Kevin)Yu、Trieu Trinh、Vikas Yadav、Vinay Ramasesh、Vinh Tran、Weiyue Wang、Wilfried Bounsi、Xiyang Luo、Yangsibo Huang、Yi Tay、Yong Cheng、Yuan Zhang、Yuri Chervonyi 和 Yujing Zhang。 这项工作由 Quoc Le 和 Vahab Mirrokni 提供指导,由 Kristen Chiafullo、Eric Ni、Srinivas Tadepalli、Jessica Lo 和 Sajjad Zafar 进行项目和运营管理。 我们还要感谢我们的竞技编程专家提供的见解:Alexander Grushetsky、Chun-Sung Ferng、Ilya Kornakov、Liang Bai、Petr Mitrichev 和 Sergey Rogulenko。 我们要向 Gemini 服务团队表示最深的感谢:Abhijit Karmarkar、Cip Baetu、Emanuel Taropa、Evan Senter、Federico Lebron、Girish Ramchandra Rao、Greg Anielak、Hamish Tomlinson、Hayden Jeune、Jia Zhao、Joe Stanton、Ashish Shenoy、Jonathan Kairupan、Juliette Love、Justin Mao-Jones、Kashyap Krishnakumar、Ken Franko、Mahesh Palekar、Minh Giang、Nikhil Sethi、Rohan Jain、Rohit Varkey Thankachan、Soheil Hassas Yeganeh、Thomas Jimma 和 Vitor Rodrigues。 进一步感谢以下人员的支持、协作和建议:Benoit Schillings、Ed Chi、Koray Kavukcuoglu、Jeff Dean、Oriol Vinyals、Noam Shazeer、James Manyika、Yossi Matias、Philipp Schindler、Pushmeet Kohli、Demis Hassabis、Sergey Brin、Melvin Johnson、Omer Levy、Timothy Lillicrap、Anca Dragan、Slav Petrov、Ya Xu、Madhavi Sewak、Erika Gemzer、Eugénie Rives、Erica Moreira、Tulsee Doshi、Alex Goldin、Jane Labanowski、Andy Forbes、Sean Nakamoto、Yifeng Lu、Denny Zhou、Alexander Novikov、Cristy Hayner、Hanada Tatsuki、Harsh Dhand、Ritu Ghai、Hiroki Kayama、Jenny Rizk Nicholls、Jo Chick、Song Zuo、Pratyusha Mukherjee、Shibo Wang、Carlos Guia、Xiaofan Zhang…… 最后,我们感谢来自 ICPC 全球的 Bill Poucher 博士的支持和认可。 ICPC 全球确认了我们提交的解决方案是完整的且被接受的。需要注意的是,他们的评审不涉及验证我们的系统、流程或底层模型。

相似文章

在 Gemini 应用中尝试 Deep Think

Google DeepMind Blog

Google 正在为 Gemini 应用中的 Google AI Ultra 订阅者推出 Deep Think,这是一项新的推理能力,采用并行思维技术,在 2025 IMO 基准测试中达到铜牌级性能。完整的金牌级版本正与精选数学家分享用于研究目的。

使用 Gemini Deep Think 加速数学与科学发现

Google DeepMind Blog

DeepMind 宣布 Gemini Deep Think 具备解决数学、物理学和计算机科学领域专业研究问题的能力,其核心亮点在于全新智能体 "Aletheia",能够迭代式地验证和修正解决方案。

Gemini 2.5:我们最聪慧的模型进一步升级

Google DeepMind Blog

谷歌发布 Gemini 2.5 系列更新,包括性能改进的 2.5 Pro 和 Flash 模型,新增功能包括 Deep Think(增强型推理模式)、原生音频输出和通过 Project Mariner 实现的计算机使用能力。这些模型现已在 WebDev Arena 和 LMArena 排行榜中领先。

Gemini 2.5:我们最智能的AI模型

Google DeepMind Blog

Google推出了Gemini 2.5,这是其最智能的AI模型。Gemini 2.5 Pro Experimental在LMArena基准测试中领先优势显著,并通过改进的思维模型架构展现了增强的推理和编码能力。