//國產AI研究已經邁入世界舞台!//
由DeepSeek團隊共同完成、DeepSeek創始人梁文鋒擔任通訊作者的DeepSeek-R1推理模型研究論文,日前登上國際權威期刊《自然(Nature)》封面,這意味著DeepSeek-R1成為全球首個經過同行評審的主流大語言模型。
《自然》發布評論指出, 目前幾乎所有主流的大模型都還沒有經過獨立同行評審,這一空白「終於被DeepSeek打破」。評論又指,依靠獨立研究人員進行同行評審,是應對AI行業炒作的一種方式,希望更多AI公司能夠效仿DeepSeek。
據傳媒報道,與今年1月發布的DeepSeek-R1的初版論文相比,是次論文披露更多模型訓練的細節,並正面回應模型發布之初的蒸餾(模型壓縮和知識轉移技術,指將複雜模型的知識遷移到輕量的模型)。梁文鋒團隊報告稱,DeepSeek-R1模型使用了強化學習而非人類示例來開發推理步驟,減少了訓練成本和複雜性。
DeepSeek團隊更首次公開R1訓練成本,僅為29.4萬美元(折合約228.6萬港元)。這個金額即使加上約600萬美元的基礎模型成本,遠低於OpenAI、Google訓練AI的成本。
圖片來源:網上圖片
請Follow我們的YouTube頻道:https://bit.ly/2kgU8qg
下載我們的手機應用程式,收看第一手精彩內容:https://www.speakout.hk/app
評論