國產AI闢新徑,高效開源惠全球
28/01/2025
內地人工智能(AI)初企DeepSeek價廉物美的大語言模型,突受海內外追捧,觸發芯片業小股災。各界驚歎連連,中企另闢算法程序突破硬件樽頸,但與其說白宮科技圍堵失敗,這更反映開源合作才是環球進步之源。
據加州大學柏克萊分校的AI模型表現排行榜,DeepSeek上周公布的R1版,與OpenAI最新的ChatGPT並列第3,僅略遜Google名下Gemini兩個版本。而且,DeepSeek免費讓人寫程式、作文、計算等,好評連連,不僅剛於美國的程式商店一舉壓下ChatGPT登頂,在英國、內地等市場的下載量同樣稱冠。
DeepSeek一直開放原始碼集思廣益,刪減個別訓練範疇,提升了演算效率,既毋須用上華府禁制的頂級製程芯片,亦能減少芯片用量,結果僅以5%或更低成本,即可交出足媲美西方巨企大模型的效能。
芯片股縱急挫,需求方興未艾
財金市場乍現疑慮,科企近年競相投入天文數字購入AI芯片,未來沒法持續。亞太半導體股份昨由日企領跌,連內地中芯國際 (00981) 亦低收7.6%;過去1年估值不止倍升的美國芯片龍頭Nvidia也好,表現反覆的荷蘭光刻機一哥ASML也好,隨後均急曾瀉逾一成。
不過,大家切忌因一時驚惶失措,作出武斷研判。經濟學的「傑文斯悖論」(Jevons paradox)指出,當科技提高資源運用效率,成本下降也同樣會推高需求,最終人類反而耗用更多資源的例子,屢見不鮮。
雲端硬碟的躍進,令人們普遍比以往儲存得多照片錄像,網絡頻寬的提升,亦促成更高解象和複雜的娛樂。美國AI初企Perplexity毫不諱言,準備應用DeepSeek R1的推理能力。訓練成本下降,有望支持AI模型更普及應用,讓小企業都可負擔,令所需芯片不減反增。
撇除愈漸對內封閉的OpenAI舵手,美國科技創投界重量級人馬普遍激賞,中企憑藉定向試誤法,重演了AlphaGo戲碼,不依賴人類既有圍棋知識,一樣青出於藍。
華企破美圍堵,拒一直搭便車
特朗普顧問、矽谷投資者Marc Andreessen讚歎之餘,還形容DeepSeek R1橫空出現,猶如AI發展的「斯普尼克時刻」(Sputnik moment),指涉蘇聯1950年代末突然搶先美國連發射兩枚人造衛星上太空敲響的警號,不知華府會否有跟進行動。
美國抱持新冷戰思維下,2021年起不斷加碼遏阻中國的高端芯片供應和技術發展。DeepSeek固然證明了就算芯片算力稍遜,一樣可藉演算法效率突圍,但若說中方今後可輕易彎道超車,無異於沖昏了頭腦。
DeepSeek創辦人梁文鋒去年罕有受訪時,經已公開承認,高階芯片禁運乃公司營運難題。事實上,以美企的算力優勢,只要借助DeepSeek的公開研究,即能比華企更易改善AI大模型。只是,按梁文鋒所想,隨着中國經濟發展,是時候逐步成為科技貢獻者,不能一直搭便車,有信心公司的創新組織和文化,足可建成「護城河」。
從央媒報道可見,梁文鋒日前應邀向總理李強的《政府工作報告》建言,中方必然不會讓華府在芯片技術,繼續亂卡脖子。利用已有技術突破,廣泛而廉宜地應用大模型到日常生活,提升生產效率,相信是內地正全力審視的議題,特區政商學研各界別也不能在這場AI大潮落後掉隊。
【你點睇?】陳茂波強調預算案將以節流為主,醫教開支、2元乘車、公務員薪酬,你最認同哪個節流方法?► 立即投票