中國人工智能公司DeepSeek正式發布並開源全新系列模型DeepSeek-V4預覽版,推出Pro與Flash兩個版本。今次是DeepSeek自去年初以開源推理模型R1震撼全球AI市場後,規模最大的技術升級。

DeepSeek-V4-Pro在Agent能力、世界知識與推理性能三大維度,達到開源領域領先水平。在Agentic Coding評測中,V4-Pro位列當前開源模型最佳水平,內部評測顯示其使用體驗優於Sonnet 4.5,交付質量接近Opus 4.6非思考模式。世界知識測評方面,該模型大幅領先其他開源模型,僅稍遜於Gemini-Pro-3.1。在數學、STEM及競賽型代碼測評中,V4-Pro超越所有已公開評測的開源模型,成績比肩世界頂級閉源模型。

DeepSeek-V4-Flash定位為經濟高效的選擇,參數及激活規模較小,世界知識儲備稍遜於Pro版本,但推理能力接近,可提供更快、成本更低的API服務。在Agent測評中,Flash版本在簡單任務上與Pro旗鼓相當,但高難度任務仍有差距。

兩款模型均支持100萬token(1M)超長上下文,並採用創新注意力機制,在token維度進行壓縮,結合DSA稀疏注意力技術,顯著降低計算與顯存需求。DeepSeek宣布,1M上下文將成為其所有官方服務的標配。此外,V4系列針對Claude Code、OpenClaw等主流Agent產品進行適配優化。

API服務已同步上線,開發者將模型參數改為deepseek-v4-pro或deepseek-v4-flash即可調用,接口兼容OpenAI ChatCompletions及Anthropic兩套標準。兩版本均支持非思考模式與思考模式,後者提供high及max兩級思考強度設置。

據彭博報道,DeepSeek於2025年推出R1開源模型後,曾引發全球科技股萬億美元拋售,促使市場重新審視巨額AI投資的效益。儘管如此,美國科技巨頭2026年在AI基礎設施及數據中心的投資規模預計仍將達到約6500億美元。