史丹福大學HAI研究所發表長達423頁的《2026年AI指數報告》,揭示全球AI產業權力版圖劇變。報告核心結論指出,中美頂尖AI模型性能差距已基本抹平,目前僅相差2.7%;同時,AI能力正以史無前例的速度加速進化,但在負責任AI及就業衝擊等社會治理層面,人類顯然未能跟上技術步伐。
報告對比Chatbot Arena榜單數據,自2025年初以來,中美頭部模型已多次換位。截至3月,美國Anthropic的Claude Opus 4.6以1503分領先,中國豆包(dola-seed-2.0-preview)以1464分緊追,差距僅39分(2.7%)。在頂級模型數量上,2025年美國發布50個顯著模型,中國發布30個,雙方在頭5位中平分秋色。更關鍵的是,開源生態重心明顯東移,DeepSeek、千問(Qwen)等中國模型推動能力邊界,且中國在AI論文發表、被引用、專利產出及工業機器人裝機量,都居於全球首位。
報告指出,2025年全球95個代表性頂尖模型中,超過90%來自產業界而非學術界,顯示前沿技術已主要由企業主導。AI能力未遭遇瓶頸,反而加速狂飆:在編程基準測試SWE-bench上,模型成績1年內從60%飆升至近100%;在博士級科學問題、多模態推理及競賽數學上,前沿模型已追平或超越人類。不過,AI呈現嚴重「偏科」,能取得國際數學奧林匹克金牌的模型,讀取模擬時鐘的正確率,卻僅達50.1%。
報告發現,AI衝擊就業已從預測變為現實。2024年起,22至25歲美國軟件開發者的就業人數已下滑20%,入門崗位被精準削減。同時,AI普及速度創歷史紀錄,生成式AI在3年內,人口採用率達到53%,超越個人電腦和互聯網。中國職場AI使用率高達80%,遠超全球平均58%。
不過,負責任AI發展明顯滯後,2025年記錄的AI事故激增至362宗(2024年為233宗),而且安全基準測試未能跟上能力增長。另外,美國吸引全球AI人才的能力過去7年暴跌89%,過去1年即跌80%,顯示其人才磁吸效應正在減弱。