找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 82|回复: 0

震撼!OpenAI在2025国际大学生程序设计竞赛拿下满分夺得第一,谷歌也取得金牌成绩

[复制链接]

2093

主题

0

回帖

6467

积分

管理员

积分
6467
发表于 2025-9-18 09:00:32 | 显示全部楼层 |阅读模式


在阿塞拜疆巴库举行的 2025年国际大学生程序设计竞赛(ICPC)全球总决赛中上,来自 100 多个国家的 139 支大学队伍在五小时内角逐解决 12 个算法问题,最终圣彼得堡国立大学凭借解决 11 个算法问题夺得人类冠军。在相同约束条件下的并行 AI 赛道上,谷歌的 Gemini 2.5 Deep Think 模型解决了 10 个问题,获得了与金牌相当的成绩。

最震撼的是OpenAI 的内部推理模型获得了 12 /12的满分,超越了所有人类队伍,拿下第一

值得注意的是OpenAI和谷歌的模型都解决了所有人类参赛队伍都没有解决的问题c。OpenAI的内部推理模型在经过9次尝试后解决了最难的问题,其余问题都是一次解决

OpenAI:获满分成绩,超越人类冠军

OpenAI的推理系统在本次竞赛中取得了12题全解的完美成绩,该成绩超过了所有人类参赛队伍



成绩与排名:解决了全部12个问题。如果参与人类排名,该成绩将位列第一。本届最优秀的人类队伍解决了11个问题

比赛条件:AI参加了官方的现场AI赛道,与人类选手共享5小时的比赛时限,并接收完全相同的PDF格式题目。系统自主选择并提交答案,无人工干预

解题详情:在12个问题中,11个为一次性提交正确。最难的一个问题在第9次提交后成功解决



技术构成:参赛系统由多个通用模型组成,包括GPT-5和一个实验性推理模型。其中,GPT-5解决了11题,实验性推理模型解决了最难的第12题,并负责最终提交决策。所有模型均未针对ICPC进行专门训练

Google DeepMind:获金牌级表现

谷歌DeepMind的Gemini 2.5 Deep Think系统在竞赛中解决了10个问题,达到了金牌级别



成绩与排名:解决了12个问题中的10个。该成绩达到了金牌分数线(前四名队伍获金牌),如果参与排名,将位列第二

比赛条件:AI在一个远程在线环境中比赛,遵循ICPC规则,比人类选手晚10分钟开始

关键亮点:独立解决了“Problem C”,这个问题在本次比赛中没有任何一支人类大学队伍能够解决。Gemini在比赛开始后半小时内完成了该题

解题效率:在比赛开始45分钟内解决了8个问题,三小时内完成了全部10个问题

人类队伍排名:





1.第一名:圣彼得堡国立大学 (St. Petersburg State University)

*   解题数:11

*   总罚时:1478

2.第二名:东京大学 (The University of Tokyo)

*   解题数:10

*   总罚时:1116

3.第三名:北京交通大学 (Beijing Jiaotong University)

*   解题数:10

*   总罚时:1425

4.第四名:清华大学 (Tsinghua University)

*   解题数:9

*   总罚时:865

5.第五名:北京大学 (Peking University)

*   解题数:9

*   总罚时:887

6.第六名:哈佛大学 (Harvard University)

*   解题数:9

*   总罚时:995

7.第七名:萨格勒布大学 (University of Zagreb)

*   解题数:9

*   总罚时:1075

8.第八名:麻省理工学院 (Massachusetts Institute of Technology)

*   解题数:9

*   总罚时:1123

9.第九名:中国科学技术大学 (University of Science and Technology of China)

*   解题数:9

*   总罚时:1128

10.第十名:首尔大学 (Seoul National University)

*   解题数:9

*   总罚时:1133

至此,OpenAI在 IOI 中获得第 6 名,在 AtCoder 竞赛中获得第 2 名ICPC2025上取得了满分,2026年人类的编程能力可能会永远落后于AI,不单单是个人coding能力还包括软件工程能力
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|花享网 ( 琼ICP备2024046163号-1 )

GMT+8, 2025-12-1 15:53 , Processed in 0.216493 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表