阿里巴巴(09988.HK)發布千問旗艦推理模型Qwen3-Max-Thinking,指模型創下數項權威評測全球新紀錄。
阿里股價造好,最新報168.6元,升3.4元,升2%。
阿里巴巴指,千問新模型總參數超萬億,進行更大規模的強化學習後訓練,並通過推理技術的系列創新,實現性能大幅飛躍,在涵蓋事實知識、覆雜推理、指令遵循、人類偏好對齊、Agent能力等19個公認的大模型基準測試中,Qwen3-Max-Thinking刷新數項最佳表現(SOTA)紀錄,特別在科學知識(GPQA Diamond)、數學推理(IMO-AnswerBench)、代碼編程(LiveCodeBench)等多項關鍵性能基準測試中表現優異,達到國際領先水平。
阿里指,在完成初步的工具使用微調後,通義團隊對模型進一步在大量多樣化任務上,進行基於規則獎勵與模型獎勵的聯合強化學習訓練,使得Qwen3-Max-Thinking擁有更智能結合工具進行思考的能力。
阿里說,模型可以自主選用搜索、個性化記憶和代碼解釋器等三個核心的Agent工具功能,提供專業人士一樣水平的回答,更合用戶心意、更智能、更流暢。同時,模型幻覺也大為降低,為解決真實複雜任務打下基礎。
目前,開發者可在QwenChat上免費體驗Qwen3-Max-Thinking模型,企業可通過阿里雲百煉獲取新模型API服務。普通用戶可通過千問PC端和網頁端體驗,千問APP也即將接入。
國金證券指出,2026年AI大模型已超越技術底座範疇,演進為AI時代具有統治力的流量入口。模型強大的語義理解、數據分析多模態生成能力,正在營銷等多高頻場景,獲得商業化紅利。