//國產AI震驚全球,美國政客又眼紅了~//
國產AI黑馬DeepSeek(深度求索)自1月20日正式發布大模型DeepSeek R1後,該應用程式短短一周更超越ChatGPT,登上蘋果App Store中國內地、香港和美國的免費App下載榜首位,轟動全球。DeepSeek R1在數學、編程和推理等關鍵領域,與OpenAI的最強模型性能相當,而且API調用成本低90%至95%,震驚市場。更在蘋果中國和美國地區App Store免費下載榜中登頂,其中在美國地區下載榜上。
DeepSeek的發布令美國股市震盪,科技公司Nvidia(英偉達)的股價,於周一(27日)單日暴跌近17%,市值損失創紀錄的5,890億美元。美國總統特朗普則指,這間由中國公司推出的AI產品,應對美國AI行業敲響「警鐘」。
根據DeepSeek介紹,R1的預訓練費用只有557.6萬美元,在2048塊輝達H800 GPU(針對中國市場的低配版GPU)集群上運行55天完成,且該模型每百萬個token的查詢成本僅為0.14美元,而OpenAI的成本為7.50美元,便宜了98%,甚至允許開源。在數學、代碼、自然語言推理等任務上,其性能比肩美國OpenAI o1正式版。
DeepSeek R1的出色表現引來多位AI行業專家和從業者盛讚。百度(9888)前首席科學家吳恩達在冬季達沃斯論壇上表示,對DeepSeek的進展印象深刻,並認爲他們能夠以非常經濟的方式訓練模型。
Nvidia高級研究科學家范麟熙(Jim Fan)稱讚DeepSeek取得了突破,他在社交平台X上發文稱,DeepSeek R1完全由強化學習驅動,「這讓人想起了AlphaZero,從零開始學習圍棋、將棋和國際象棋,而不是先模仿人類大師的動作。」
微軟行政總裁Satya Nadella也公開表示,DeepSeek切實有效地開發了一款開源模型,在推理計算方面表現出色,而且超級計算效率極高;他更強調,「我們必須非常、非常認真地對待中國的這些進展」。
華爾街頂級風投A16z創始人Marc Andreessen更稱,DeepSeek-R1是其見過最令人驚歎、最令人印象深刻的突破之一,並且是「開源」、是「給世界的禮物」。
DeepSeek全稱杭州深度求索人工智能基礎技術研究公司,成立於2023年7月。其創辦人梁文鋒1985年出生於廣東省湛江市,今年約40歲,浙江大學畢業,擁有資訊與電子工程學系學士和碩士學位。他早於2008年起開始帶領團隊使用機器學習等技術探索全自動量化交易,到2015年正式成立幻方量化,2019年資金管理規模更突破百億元。及至2023年,梁文鋒宣布進軍通用人工智能領域,專注於做真正人類等級的人工智能;同年幻方量化正式宣布成立大模型公司DeepSeek。
在2023年11月2日,公司已推出首個模型DeepSeek Coder,該模型免費供商業使用且完全開源;11月29日推出DeepSeek LLM,參數規模達67B,性能接近GPT-4,同時還發布了聊天版本DeepSeek Chat。
真正讓Deepseek在AI界受關注,是其在去年5月開源的第二代MoE大模型DeepSeek-V2,該模型在性能上比肩GPT-4 Turbo,價格卻只有GPT-4的百分之一,因此被稱為「價格屠夫」及「AI界的拼多多」。隨後在2024年下半年,還先後發布了DeepSeek R1-lite-preview和DeepSeek-V3。
直到今年推出R1模型,在MATH基準測試上達77.5%準確率,與OpenAI的o1不相上下;在編程領域,R1在Codeforces評測中達2441分水平,高於96.3%的人類參與者。更重要的是,這是在不到600萬美元的投入和2048塊低性能的H800芯片的條件下完成,訓練時間僅用兩個月,令全球側目。
本月20日,國務院總理李強主持召開專家、企業家和教科文衛體等領域代表座談會,聽取對《政府工作報告(徵求意見稿)》的意見建議,梁文鋒在會上發言。央視《新聞聯播》播出該畫面,讓許多人第一次看到了他的真實面孔。
不過,DeepSeek於周日(26日)及周一均出現「死機」的情況,到周二(28日)凌晨再傳出「死機」災情,許多用戶反映無法登入或註冊,或是無法進行對話。DeepSeek官網於周二(28日)凌晨表示,近期網上服務受到大規模惡意攻擊,為持續提供服務,暫時限制中國內地手機號碼以外的註冊方式;至於已註冊用戶可以正常登錄。
圖片來源:網上圖片
請Follow我們的YouTube頻道:https://bit.ly/2kgU8qg
下載我們的手機應用程式,收看第一手精彩內容:https://www.speakout.hk/app
評論