內地AI大模型廠商智譜AI,宣布開源核心AI Agent模型AutoGLM。模型是經過32個月研發、具備"Phone Use"(手機操作)能力的智能體框架。意味著硬件廠商、手機廠商和開發者,都可以基於AutoGLM,在自己的設備或系統中,複製一個能夠"看懂"屏幕、並模擬真人進行點擊、輸入、滑動的AI助手。

早前,字節跳動旗下的AI大模型豆包,和中興通訊合作推出內置AI智能體的手機,可以根據客戶簡單指令,調用多個互聯網應用,完成一系列操作,引起市場關注豆包智能體,會取代各個大廠應用的用戶入口功能。

隨後,微信、淘寶及多家銀行的應用程式,隨即啟動防禦機制,當豆包助手嘗試接管微信或淘寶時,會出現異常退出、風險提示甚至封號的情況。大廠的理由是"安全與隱私",但行業普遍認為,是對流量入口和數據控制權的保衛戰。

而智普推出的AutoGLM,已支持微信、淘寶、抖音、等超過50個高頻中文應用的核心場景,自動化操作能力與"豆包手機"的演示相似。AutoGLM有別於依賴易被封禁的無障礙服務(Accessibility),而是在底層調用ADB(Android Debug Bridge)指令,並結合視覺大模型。運行邏輯是"看屏幕截圖 -> 大模型分析 -> 模擬手指點擊"。這種基於視覺的"類人操作",令互聯網應用程式廠商,極難通過簡單的代碼檢測進行防禦。只要人眼能看懂界面,AI就能操作。

智譜表示,AutoGLM項目正式在GitHub上線,開源包括訓練好的核心模型、Phone Use能力框架與工具鏈,以及覆蓋50個以上高頻中文應用的可跑通Demo。智譜表示,AutoGLM 開源的第一層初衷,是將這一層能力變成整個行業可以共同擁有、共同打磨的公共底座。

對於互聯網平台提到的隱私安全問題,智譜在開源公告中表示,AutoGLM的技術向整個生態開放,數據與隱私,永遠留在使用方的一側。AutoGLM支持私有化部署,會在雲端虛擬手機中訓練,而實際運行時,企業和開發者可以在自己的合規環境中掌控數據,模型運行和數據處理都在用戶設備端完成,數據不出手機。

分析指,智譜AutoGLM的開源具有里程碑式的意義,是商業模式的重構。中信證券的報告指,AI Agent之於手機,正如自動駕駛之於汽車。之前,手機廠商苦於缺乏能夠打通所有應用的超級入口,而AutoGLM的開源為手機製造商,甚至中小硬件開發者,提供現成的技術底座。參考汽車行業"華為+賽力斯"的智選模式,未來"大模型廠商+手機廠商"的深度綁定將成為常態,AI手機有望迎來類似新能源汽車的爆發式增長。

分析指,對於騰訊、阿里等互聯網巨頭而言,護城河正面臨嚴峻挑戰。當用戶可以通過AI Agent繞過APP的首頁推薦、廣告位,直接觸達核心服務(如直接訂票、比價購物),超級APP的流量分發邏輯將失效。智譜的開源將這種能力泛化後,巨頭可能面臨2個選擇:死守高牆,冒著用戶體驗下降的風險;或者主動談判,開放API,與AI Agent共建新生態。

而AutoGLM的開源標誌手機Agent進入"可編程"時代。未來,基於AutoGLM框架,可能會誕生出專門服務於視障人士的公益Agent、專注於特定工作流程的效率Agent,甚至是完全個性化的私人助理。

分析指,從豆包手機面世,到智譜AutoGLM的開源,中國互聯網在短短10日內,經歷了一場關於入口、流量與控制權的劇烈震蕩,智能體時代的來臨似乎無法阻擋,同時開啟一個端側智能體經濟的萬億級新賽道。