阿里巴巴(09988.HK)旗下大模型通義千問Qwen更新了旗艦版Qwen3模型,推出Qwen3非思考模式的更新版本,並大幅提升了長文本處理的能力,擴展到256K的文本長度,通用能力顯著提升,包括指令遵循、邏輯推理、文本理解、數學、科學、編程及工具使用等方面,在GQPA(知識)、AIME25(數學)、LiveCodeBench(編程)、Arena-Hard(人類偏好對齊)、BFCL(代理能力)等眾多測評中表現出色,超過Kimi-K2、DeepSeek-V3等頂級開源模型以及Claude-Opus4-Non-thinking等領先閉源模型。
阿里雲表示,在經過與社區溝通和深思熟慮後,決定停止使用混合思考模式,轉為分別訓練指示(Instruct)和思考(Thinking)模型,以獲得最佳質量。
內地科技界分析指,Qwen3提升長文本處理能力,擴展到256K文本長度,無疑將大幅提升模型的應用潛力,特別是在需要處理大量信息的場景中。
目前Qwen3新模型已在魔搭社區和HuggingFace上開源更新,允許開發者和研究者自由使用與修改。分析指,通義千問這次更新再次引發了行業廣泛關注。與其他大型AI模型如OpenAI的最新發布相比,Qwen3模型在處理複雜任務時的高效性和靈活性,將是競爭優勢一部分。此外,隨著開源社區支持,Qwen3模型的使用場景將不斷擴大。