OpenAI新模型东大入学试夺503分!数学科满分 破纪录超人类考生

撰文: 贾桂琳
出版:更新:

AI发展一日千里,其聪明程度已可超越大部份人类!日本媒体《日经新闻》联合东京AI初创公司LifePrompt(生命提示)及知名补习学校河合塾(Kawaijuku)发表最新调查,显示OpenAI的最新模型,在2026年东京大学与京都大学入学考试表现远超预期,不仅超越所有考生取得最高分,在东京大学医学部理科三类考试(日本公认最难入学考试)中刷新历年最高分纪录,在数学科更夺得满分,展现出超越人类考生的应试能力。

OpenAI 的最新模型,在2026年东大与京大的入学考试表现远超预期,刷新历年考生最高分纪录。(AI生成图片)

2年内由“落榜”变“首席”

据《日经新闻》报道,此次测试聚焦东京大学与京都大学这两所日本顶尖大学的入学考试,OpenAI的“ChatGPT-5.2 Thinking”系统作为核心测试对象,接受了全方位考核。在总分为550分的东大入学考试中,该系统取得503分,远超该校理科合格录取最高分的453分;人文科亦取得452分,同样高于人文科合格录取最高分434分。面对今年难度提升的数学考卷,AI系统实现满分,英语成绩亦达到90%,展现出极强的逻辑推理与语言处理能力。

“ChatGPT-5.2 Thinking”系统成绩远超人类考生合格录取最高分。(《垫底辣妹》剧照)

值得留意的是,这一成绩较该AI模型此前的表现有跨越式进步。2024年,该模型在东大入学考试中全线落榜,但在短短2年时间,已由“不及格”进化为足以碾压顶尖天才的“超级考生”,被LifePrompt团队亲切称为“Chappy”的AI,其表现已成为日本教育界的热话。

短短2年时间,AI的考试成绩已由“不及格”进化为“首席”。(AI生成图片)

Google Gemini亦表现强劲

研究团队将考卷题目转化为图像数据输入AI系统,为保证评分公平性,包含文字描述的答案均由河合塾的专业教师按照官方评分标准逐一评定,以确保结果具备权威性。除OpenAI模型外,Google的Gemini 3.0 Pro模型也同样参与了测试,在15个主要科目中取得均分91.4的好成绩,同样远超考生平均水平,性能同样大幅领先人类考生平均水平。

日本网民热议:AI超级考生出现 人类真正价值在哪?

消息在日本网络掀起热烈讨论。有日本网民慨叹,AI虽然能解题、拿满分,却不懂得出好题,它拟定的题目往往太过简单或逻辑混乱,可见创造与设计的能力仍属人类。亦有人指出,东大入学测试这类知识型、逻辑型考试,AI超越人类实属意料之中,就如当年AlphaGo击败人类棋手一样,只是AI发展路上的一个里程碑,很快大众便会习以为常。

2017年AlphaGo击败世界围棋冠军柯洁拿下首胜。(网络图片)

不少网民开始反思教育制度的未来。有评论指出,当AI能轻易应付知识型及逻辑型考试时,人类的价值将转向“判断力”与“责任承担”。未来人才的竞争力,或许不再是“记得多少、算得多快”,而是能否质疑AI的输出,并将知识转化为现实的决策。