中國人工智能大模型2月份密集式升級,帶動調用量爆發式增長,2月份首次超過美國。全球最大的API聚合平台OpenRouter數據顯示,2月9日至15日的一星期,中國模型的調用量達到4.12萬億Token,首次超過同期美國模型的2.94萬億Token。

之後在2月16日至22日的星期,中國模型的周調用量進一步升至5.16萬億Token,3星期內上升127%,而同期美國模型調用量跌至2.7萬億Token。同時,全球調用量排名前5位的模型中,中國模型佔據四席。

Token是AI模型處理文本的最小單位,相比用戶數目,更能真實反映AI模型使用強度。而OpenRouter平台,匯聚全球數百種大語言模型,擁有超過500萬開發者用戶,其中美國用戶佔比高達47%,而中國開發者只佔6%,令到數據更能反映中國大模型在全球範圍的真實吸引力。

全球大模型調用量1年增逾10倍

內地傳媒引述OpenRouter數據,顯示全球大模型Token調用量,過去1年出現爆發式增長。2025年3月3日至9日的1周,平台前10大模型的周調用量只是1.24萬億Token。到今年2月中旬,已飆升至13.95萬億Token,不到1年時間增長超過10倍。

2025年,美國模型的Token周調用量,一度佔據前10大模型總量的近7成,同期的中國模型佔比不到2成。但進入2026年情況扭轉,中國模型由追上至超越美國模型,而且並非依賴單一產品,而集群式崛起。上星期平台調用量排名前5的模型,4款來自中國廠商,分別為MiniMax的M2.5、月之暗面的Kimi K2.5、智譜的GLM-5以及DeepSeek的V3.2,4款模型合計貢獻前55總調用量的85.7%。其中MiniMax在2月13日發布的M2.5模型,上線不足1星期便迅速登頂周調用量榜首。

而月之暗面的Kimi K2.5模型,調用量實現連續跳漲。模型能調度多達100個"Agent分身"並行工作,將複雜任務處理效率提升3到10倍。報道指,Kimi在發布Kimi K2.5後不到1個月的累計收入,已超過2025年全年的總收入,增長主要由全球付費用戶及API調用量大漲共同推動。

a16z:矽谷初創核心模型8成使用中國開源模型

而阿里千問雖然單個模型上榜頻次不高,但風投機構a16z與OpenRouter聯合發布的報告顯示,千問全系列模型總Token調用量,以5.59萬億位居全球第2,僅次於DeepSeek的14.37萬億。諮詢公司弗若斯特沙利文的報告顯示,在中國大模型B端市場,去年下半年千問系列模型的日均Token調用量佔比32.1%,位列第一,相較上半年的17.7%幾乎翻倍,相比字節豆包的21.3%和DeepSeek的18.4%,領先優勢擴大。

a16z的合夥人Martin Casado指,目前在矽谷尋求融資的AI初創公司中,路演的核心模型有高達80%使用中國的開源模型。成本是中國模型其中一個顯著優勢,OpenRouter公示的價格,在處理輸入信息的環節,MiniMax的M2.5與智譜的GLM-5,價格均為0.3美元每百萬Token。海外主流的對標產品Claude Opus4.6的價格,則高達5美元,是中國2款模型的約16.7倍。

而在模型生成內容的環節,成本差異更大,MiniMax M2.5的輸出價格為1.1美元每百萬Token,智譜GLM-5為2.55美元,而Claude Opus4.6的價格高達25美元,是MiniMax的22.7倍和智譜的9.8倍。

中國成本優勢源自算法革新

弗若斯特沙利文中國總監李慶分析,中國模型革新算法架構,採取"混合專家"(MoE)架構的技術路線,是能夠大幅降低推理成本的核心原因之一,相較於傳統每次計算都調用全部參數的稠密模型,能夠極大減少計算量和對硬件資源的需求。

摩根大通的報告,預計從2025年到2030年,中國Token消耗量的年複合增長率將達到330%,在短短5年間預計增長370倍。而AI Agent的興起和普及,預計將放大Token的消耗。李慶預測,未來單一的定價模式,將無法覆蓋所有商業需求,未來多維度、動態的定價體系將成為主流。