內地人工智能大模型DeepSeek發布兩個正式版模型DeepSeek-V3.2和DeepSeek-V3.2-Speciale,指V3.2在公開推理測試能夠匹敵OpenAI的GPT-5,表現僅略低於Gemini-3.0-Pro。而V3.2-Speciale在主流推理基準測試上的性能表現更媲美Gemini-3.0-Pro,在國際數學奧林匹克競賽和國際信息學奧林匹克競賽等標準化測試中的表現亦能達到金牌水平。

DeepSeek表示,V3.2目標是平衡推理能力與輸出長度,適合日常使用,例如問答場景和通用Agent任務場景。而V3.2-Speciale的目標是將開源模型的推理能力推向極致,並探索模型能力的邊界。

DeepSeek官方網頁、APP和API服務已全面更新至V3.2版本。兩款模型均已在HuggingFace和ModelScope平台開源。而V3.2-Speciale目前僅以臨時API形式開放至15日,供社區評測與研究使用。