國際數學奧林匹克(IMO)今年首度成為全球人工智能領軍企業Google DeepMind和OpenAI的角力場,兩間公司皆宣布旗下AI系統首次取得金牌水準,與全球最優秀高中生比肩,標誌著AI在複雜數學推理領域的重大突破。

Google DeepMind 旗下新一代Gemini Deep Think模型正式參賽,按照奧數官方規定在9小時內解答六道極具挑戰性的題目,成功完美解出其中五題,獲得35分,達到金牌線。而DeepMind的答案經過奧數官方工作人員核准與計分,與人類參賽者完全同等標準。

而OpenAI就是在官方比賽結束後,將自家尚未公開發布的通用大型語言模型,套用到本屆奧數題目,並遵循比賽條件作答,同樣取得35分的金牌級表現。OpenAI是邀請3位前奧數金牌得主獨立評分。雖未正式參賽,但成績亦被公認為技術里程碑。

OpenAI則是提前在社交媒體上自行公布取得金牌成績,但成績並未經過奧數官方評審團評估,也沒有奧數官方評委直接參與評審,是未經官方認證的自評結果。

奧數主辦方要求所有參加AI評測的團隊在閉幕結束後至少等待一周才可公開成績,以尊重參賽青少年,避免焦點被提前奪走,但OpenAI選擇提前在社交媒體上自行公布取得金牌成績,導致官方與學界批評做法粗魯且不恰當。