全球AI界見證中國大模型力量的爆發。全球最大AI模型聚合平台OpenRouter數據顯示,3月15日的星期,中國大模型的周調用量達4.69萬億詞元(Token),連續第2個星期超越美國,且全球調用量前3名都由中國模型包攬。
與此同時,月之暗面(Moonshot AI)旗下應用Kimi締造資本神話,不到3個月內估值增加4倍,升至180億美元,新一輪10億美元融資正在進行,晉身最快突破百億美元的「十角獸」。但矛盾正逐漸浮現,Kimi用戶在高峰時段頻繁遭遇「算力不足」提示,Kimi的算力緊張,反映需求激增,令到供給端出現明顯缺口。
需求爆炸:AI智能體與全民應用浪潮推高消耗
內地傳媒報道指,今輪算力短缺的根本推手,是技術範式的轉變。以OpenClaw為代表的智能體(Agent)框架,將大模型從問答工具,轉變為可自動執行的「數字員工」,單一智能體的Token消耗量可達普通聊天的數十倍。Kimi K2.5成為OpenClaw首選模型,吸引了海內外大量開發者,直接加劇算力負擔。摩根大通預測,中國AI推理Token消耗量將在5年內增長約370倍,印證智能體浪潮的威力。
此外,AI應用正從小眾走向全民。當AI智能體框架(如OpenClaw)開始與微信等國民級應用兼容,用戶基數將從數十萬開發者,躍升至數億普通用戶,需求的擴散速度遠超硬件產能的擴張。同時,AI任務也從聊天深化至編程、多模態處理等高消耗場景,單一視頻處理任務的消耗量已遠超日常對話。
供給瓶頸:物理極限與成本壓力傳導
目前全球高性能計算芯片(如GPU)產能擴張緩慢,加上地緣政治因素影響獲取,導致全行業面臨算力短缺與成本上漲的雙重壓力。2026年3月,阿里雲、百度智能雲、騰訊雲等中國主要雲服務商已相繼宣布上調AI算力產品價格。Kimi的「算力不足」提示,亦都體現成本壓力最終傳導至終端用戶體驗。
技術應對:從「暴力堆料」轉向「精細運營」
在物理算力受限的背景下,中國企業被迫從技術端尋求突破,例如,Kimi通過混合注意力機制、動態路由專家模型、Toggle Token(減少輸出Token 25%至30%)等技術,系統性重構架構、推理與系統層。阿里雲亦推出Aegaeon GPU池化系統,實現Token級精細調度,大幅提升單一GPU的服務能力。
未來挑戰:系統整合能力決定勝負
國金證券分析指出,在供需兩側的強力擠壓下,2026年算力產業鏈可能進入「全鏈通脹」周期,行業景氣度將從核心芯片外溢至數據中心、雲服務、電力配套等全鏈條。同時,雲廠商的角色正在從底層算力租賃商,轉變為掌控「AI數字員工」分發權的平台,算力本身已成為應用層競爭的核心門票。