DeepSeek研究員Daya Guo在X帖文,表示春節期間令他最興奮的事,是親眼見證 R1-Zero 模型性能曲線"持續增長",並且感受到強化學習(RL)的強大力量,又指仍處於非常早期的階段,RL領域還有很長的路要探索,但相信今年會看到顯著的進展。

他在回覆網友提問時有透露,6600億參數的R1-Zero和R1,是在 V3 發布之後才開始訓練的,用了大約2至3星期時間。而之前提到的R1模型,實際上是 R1-Lite 或者 R1-Lite-Zero。

而內地不同的人工智能平台和科技公司,加速向DeepSeek靠攏,聯想集團(00992.HK)與國產GPU領軍企業沐曦股份,聯合發布基於DeepSeek大模型的國產一體機解決方案。率先實現從千億參數大模型訓練,到場景化推理落地的全鏈條覆蓋,為企業提供國產化新路徑,破解算力部署複雜、技術門檻高、安全可控難三大核心難題。

DeepSeek招聘研究員年薪可達154萬元

DeepSeek亦加強招兵買馬,內地傳媒報道,DeepSeek目前在BOSS直聘等平台,發布52個招聘職位,涵蓋深度學習研究員、核心系統研發工程師及資深UI設計師等,工作地點為北京或杭州。其中,深度學習研究員月薪8萬至11萬元,年薪最高達154萬元。核心系統研發工程師,月薪6萬元至9萬元,最高年薪126萬元。實習崗位方面,AGI大模型實習生工資為每日500元至990元,按1個月22個工作日算,月薪可輕鬆過萬。

路透社報道,澳洲政府以擔心安全風險為理由,宣布禁止在所有政府設備中使用DeepSeek,並從所有政府系統和設備中,刪除所有現有的DeepSeek產品、應用程序和網絡服務。 禁令不適用於私人公民的設備。

南韓代總理指DeepSeek或重塑產業格局

南韓代理總統崔相穆表示,DeepSeek的最新人工智能模型有可能重塑產業格局,又指中國公司開發的DeepSeek R1,以低成本提供高性能,是一個新的沖擊。作為應對措施的一部分,南韓政府計劃在國有的韓國產業銀行(Korea Development Bank)內,啟動一項新的34萬億韓元(234億美元)基金,支持人工智能和半導體等尖端技術的發展。