//無論怎樣制裁,中國科技仍然能走出自己的道路。//
主持:呂暢能
論盡最新熱話、拆解新聞內幕
約定你,和你不吐不快!
逢星期一至五 6:00PM
⭕《港人講地》直播
國產人工智能初創公司DeepSeek上月發布並開源DeepSeek R1模型,隨即引起全球哄動。甚至令晶片巨頭英偉達秈市值一度蒸發6000億美元。DeepSeek第三代人工智能模型的開發成本只有約550萬美元,但性能就媲美用了幾十億美元開發的ChatGPT,令世界驚覺,中國的AI人工智能已經在世界的前端。
DeepSeek的出現打擊了美國的科技自信,美國國會眾議院「美中戰略競爭特別委員會」就表示中國AI威脅到美國國家安全,要求政府實施更嚴格的出口管制。而美國太空總署、美國海軍以及德州,亦都禁止選下部門、員工及士兵使用DeepSeek。事實一再證明由華為與中芯開發出7納米晶片,到DeepSeek的出現,已經可以看到,美國無論怎樣制裁打壓,都阻止不到中國科技的發展。
DeepSeek性能媲美ChatGPT
DeepSeek在2023年11月發布第一個大型模型,之後在2024年5月發布第二代,當時性能已經接近ChatGPT 4,而第二代採用了混合專家模型(Mixture of experts)的架構,令到DeepSeek的效率大幅提升。2024年12月,DeepSeek發布第三代模型,從DeepSeek網站的成績表顯示,第三代性能不單止超越同時期的阿里、Meta等公司的AI,部分成績甚至超越ChatGPT,之後25年1月,DeepSeek發布並開源R1模型,這個模型具有邏輯推理能力,效能與OpenAI在24年12月發布的o1相當,令全球大為震驚。英偉達亦都稱讚DeepSeek帶來了卓越的人工智能進步。
DeepSeek一鳴驚人之後,不單止受到大量黑客攻擊,甚至被美國媒體指控成本低的原因是抄襲。為何DeepSeek的成本這麼低呢?清華大學計算機系教授鄭緯民就表示,最關鍵原因是DeepSeek自行研發出混合專家模型的架構,令模型的訓練成本大幅下降。那到底混合專家模型的架構與ChatGPT的架構又有什麼分別呢?
舉例來說,AI就好像圖書館,如果是ChatGPT的架構,你想搜索一本偵探小說的時候,ChatGPT就會整個圖書館都搜尋一遍,來找出你想尋找的書。但DeepSeek就加入了類似「分流」的功能,當你想找偵探小說時,DeepSeek就會先判斷你想找什麼類型的書,再將你分流到「小說」的項目,這樣做,大大加快了模型的效率。
OpenAI一直為人詬病就是ChatGPT一點都不” Open”,因為OpenAI一直都沒有開源模型,也禁止用戶用ChatGPT訓練其他AI,但DeepSeek卻做到真正的”Open”,不單完全開源,即是任何人都可以看到其源代碼以及編程的思路,可以允許用來訓練其他AI,更加歡迎任何對模型的二次修改,這樣做,大大促進了全球人工智能的發展。
制裁阻止不到中國科技發展
美國一直以為制裁就可以阻止中國科技發展,但原來最終都是徒勞無功。美國一直禁止英偉達售賣最先進的H100晶片給中國企業,DeepSeek就使用效能較低的H800以及H20晶片來訓練AI,都可以研發出世界前列的人工智能模型。
近日就有美國傳媒報道,特朗普政府打算擴大對中國的晶片限制,將本來無列入限制的H20晶片亦納入管制當中,美國商務部亦調查DeepSeek有沒有使用美國出口管制名單中的晶片訓練AI模型。
DeepSeek威脅到美國的科技自信,會繼續受到打壓是可想而之,不過DeepSeek亦沒有坐以待斃,有內地傳媒報道,DeepSeek已經開始準備適配國產GPU晶片,相信是為了不被美國進一步限制而影響。
不論是華為、TikTok還是DeepSeek,只要看到中國的科技成功,美國就企圖用制裁來限制中國科技的發展,但事實一再證明,無論怎樣制裁,中國科技仍然能走出自己的道路。
請Follow我們的YouTube頻道:https://bit.ly/2kgU8qg
下載我們的手機應用程式,收看第一手精彩內容:https://www.speakout.hk/app
評論