內地人工智能公司DeepSeek在官方微信群發帖,指DeepSeek完成"小規模試用升級",歡迎前往官方網頁、APP、小程序測試,API接口和使用方式保持不變。內地傳媒指,DeepSeek開源R1最新的0528版本,估計很快會放出模型卡介紹更多功能。在著名代碼測試平台Live CodeBench顯示,新版的R1性能,可以媲美OpenAI最新的o3模型高版本。
報道指,今次升級主要集中在響應質量優化、響應速度小幅提升、對話穩定性增強、API和接口兼容性保持穩定。市場原本預計DeepSeek會推出R2模型,而今次R1升級,是DeepSeek自3月底以來,最新的一次動作。
目前有很多關於R2大模型的傳聞,例如參數規模達到1.2萬億,相比前代R1的6710億參數幾乎翻倍等,但未獲官方證實。傳言的1.2萬億的參數,接近國際頂尖模型如GPT-4Turbo和Google Gemini 2.0 Pro的水平,動態激活參數傳為780億,實際消耗的計算量僅為總參數的6.5%,令模型保持高性能的同時,顯著降低運行成本。
另外,DeepSeek持續擴散,不斷有公司和行業接入公司的模型。西藏大學推出"藏大智言"DeepSeek平台,西藏自治區昌都市政務雲亦完成DeepSeek大模型部署。拉薩高新區通過搭建DeepSeek政務大模型應用,率先成為拉薩市"智慧政務"試點。
瑞幸咖啡在官方APP和微信小程序,正式上線首個AI智能體,接入DeepSeek及豆包大模型,由瑞幸咖啡與火山引擎聯合打造,實現線上"動嘴點咖啡"。中科江南基於DeepSeek開發智能體,在財政業務AI智能助手、智能報告、智能輔助審核等方面向客戶提供應用。亦有一些券商利用DeepSeek讀取滬深300成份股的ESG報告等。