AI拿下奥数IMO金牌,但数学界的AlphaGo时刻还没来
日期:2025-08-04 16:46:44 / 人气:7

近期,2025年国际数学奥林匹克(IMO)在澳大利亚落幕,AI界围绕“IMO金牌认证”展开了一场激烈的人才与技术话语权争夺战。OpenAI和DeepMind先后宣布其模型达到IMO金牌标准,这一成果标志着AI在数学推理能力上取得了显著跃升,但也引发了关于AI在数学领域地位和前景的诸多讨论。
AI在IMO竞赛中的表现与竞争
双双达到金牌标准
2025年7月20日IMO在澳大利亚闭幕,OpenAI在7月18日晚就宣布其保密推理模型在IMO竞赛的6道题目中解出5道,获得35分,达到金牌线。两天后,DeepMind也宣布其Gemini Deep Think的进阶版本模型同样达到这一成就,且完全使用自然语言操作,还获得了IMO官方组委会的证明。
竞争背后的戏剧性
OpenAI提前宣布成绩引发争议,DeepMind的Demis Hassabis公开谴责。此外,媒体曝出DeepMind金牌团队三名核心研究员被Meta挖角,此前半年DeepMind已有20名员工被挖去微软,这场顶尖实验室之间的竞争愈发激烈。
与人类顶尖学生的对比
今年有72位高中生达到金牌标准,其中5位获得42分满分,完美解答6道题,而两个AI模型都只做出5道题,所以说AI在数学能力上胜过人类还为时过早,但这足以证明当下大模型具备优秀的数学能力。
IMO金牌对AI数学推理能力的证明
突破形式化证明限制
此前,DeepMind的AlphaGeometry和AlphaProof等模型虽达到银牌标准,但使用形式化证明方法,需把自然语言题目“翻译”成Lean等机器能“看懂”的语言,过程耗时久,远超IMO比赛限制。而DeepMind最新的Gemini Deep Think模型在完全自然语言输入输出的条件下达到金牌标准,直接从自然语言读题、作答,不依赖形式化工具,这证明了语言模型本身也可完成高难度数学推理,挑战了部分AI学者认为语言模型无法独立完成真正数学推理的观点。
引发学术观点变化
此前一些AI学者认为AI模型必须依托形式化语言输出可机器验证的逻辑结构,再人工转换成自然语言,如AlphaProof这样的“混合模型”才可能达到数学研究标准。但Gemini Deep Think的成功让数学家可能改变把电脑辅助数学与形式化方法等同的看法。
前IMO金牌得主对AI解题的评价
解答思路与表现
前IMO中国国家队成员胡苏麟点评,AI作答的五道题思路清晰、逻辑链条完整,获得满分实至名归。不过,在具体题目上两个AI表现有差异。如第二题平面几何题,DeepMind的解法更几何、自然,接近人类选手思路,OpenAI则使用解析几何手段,将几何题转化为代数题,计算量巨大,人类选手考场一般不会这么做。
语言风格差异
两个AI解答时会不断引入新符号定义概念或公式,这在高中竞赛中不常见,会增加理解难度。OpenAI语言风格更像课堂老师,有人性化描述词,会适当省略细节、循循善诱;DeepMind语言更书面化,像阅读数学论文。
AI用于数学研究的前景分歧
积极观点
IMO竞赛只是数学能力的一个侧面,与生活中的数学和数学家的研究目标不同。澳籍华人数学家陶哲轩认为,2023年AI就能为职业数学家生成有启发性的提示和思路,2026年与形式化证明及验证等结合使用的AI将成为数学研究中值得信赖的合作者,能在一定程度上帮助数学家。
消极观点
哥伦比亚大学的数学家Michael Harris批判AI数学,认为数学的真正意义在于自由探索和内在洞见,而非沦为市场逻辑下的技术产品。像Lean这样的计算机语言将数学简化成机器能看懂的逻辑,使数学失去自由创造和思辨力。他关注数学研究资本化趋势,担心资助者以应用价值衡量数学,忽视其内在价值,认为当前关于AI辅助数学的讨论忽略了根本问题。
促进学术研究观点
DeepMind的Pushmeet Kohli认为,AI在数学上的成就会促进数学学术研究,如同围棋选手分析AlphaGo策略发现新理论一样,AI系统能为数学家和科学家提供强大工具,帮助他们理解世界。
作者:杏耀注册登录测速平台
新闻资讯 News
- 达利欧,彻底退出桥水基金08-04
- AI拿下奥数IMO金牌,但数学界...08-04
- 育儿补贴的 “含金量”:不只是钱...08-04
- 河南电信与承包商矛盾激化,用户...08-04