一家名為「極佳視界」的中國人工智能團隊,憑藉最新研發的具身世界模型 GigaWorld-1,在一項被譽為業界「試金石」的國際權威評比 WorldArena 中奪得榜首,成為此項評比中首個綜合得分突破60分的模型,超越Google、輝達等國際科技巨頭,引發學術與產業界矚目。
「具身世界模型」是人工智能邁向通用智能的關鍵技術之一,目標是令AI能在虛擬或數字世界中,像人類一樣理解環境、預測物理變化,並規劃行動。例如,在操控機械臂或虛擬機器人時,模型必須能精準預判物體的運動軌跡、碰撞結果,並做出正確反應。這項技術是發展高階機器人、自動駕駛及高擬真模擬系統的基礎。
GigaWorld-1 今次參與的 WorldArena 評比,由清華大學、普林斯頓大學、新加坡國立大學、北京大學、香港大學、中國科學院、上海交通大學以及中國科學技術大學等,8家全球頂尖學術機構聯合設計,被公認為全球最嚴苛的世界模型測試平台,透過16項核心指標與3大真實應用任務,全方位檢驗模型的視覺感知、物理規律理解、三維空間認知與動作預測能力。能在此評比中奪冠,代表模型在技術的全面性與實用性上,獲得最高等級的認可。
根據評比結果,GigaWorld-1 在視覺真實性、幾何精確度與物理準確性三大核心維度上表現卓越,達到「全能型」水準。核心突破在於採用了獨特的架構,不單能確保模型生成的動態畫面在幾何上保持一致、不扭曲,更令模型能精確模擬並遵循真實世界中的複雜物理交互(例如物體的碰撞、滾動),大幅提升其在真實場景應用的可靠性。
GigaWorld系列模型,實現10倍推理速度與10倍訓練效率的跨越式提升,同時任務成功率大幅上漲30%,標誌著具身智能正式邁入由世界模型驅動的新紀元。在高難度長時程任務中,面對摺紙盒、沖咖啡、摺叠衣物等包含多階段操作、精細感知與持續決策的複雜場景,模型實現接近100%的任務成功率,並可穩定復現。
「極佳視界」研發團隊由清華系科研人員領軍,核心成員來自阿里、百度、地平線等中國頂尖科技企業。今次奪冠被視為一次成功的關鍵技術超車。團隊已將 GigaWorld-1 的核心代碼與部分數據集開源,半個月內,在全球知名開發者平台 HuggingFace 的下載量,已突破1.6萬次,顯示技術受到國際開發社群的關注和認可。