【FOCUS】螺絲殼裏做道場,DeepSeek致勝啟示

28/01/2025

  「算力出奇跡」VS「螺絲殼裏做道場」,到底哪個技高一籌?AI股王英偉達輝周一(27日)市值蒸發5890億美元,如對前者的當頭棒喝,盛行多年的AI核心假設--資金多即是強、算力高即是好,遭奉行後者的DeepSeek徹底打破。

 

AI多年核心假設一朝打破

 

  Meta的朱克伯格上周拋出「2025年資本支出高達650億美元」、「年底擁有130萬顆GPU」的震撼彈,短短三天後,AI界的「大躍進」敘事即畫風驟變,皆因跟OpenAI O1大模型分庭抗禮的DeepSeek-R1大模型,被揭訓練成本低至560萬美元,使用的英偉達GPU數量僅2048顆,且型號是上一代H800。

 

【FOCUS】螺絲殼裏做道場,DeepSeek致勝啟示

DeepSeek異軍突起,拖累英偉達輝周一(27日)市值蒸發5890億美元。

 

  OpenAI首席執行官Sam Altman周二最新表示,DeepSeek-R1大模型令人印象深刻,但堅稱「現在比以往任何時刻,都需要更強的算力來完成使命。」

 

強化學習+混合專家架構

 

  面對有「AI界拼多多」之稱的中國「黑馬」公司,何解Sam Altman仍執著算力?答案指向其大模型訓練路徑。據OpenAI創始成員Andrej Karpathy解釋,訓練分為4個階段:一,預訓練(「投喂」大量文字並設定權重),建立基礎LLM模型;二,監督微調(以少量高品質的資料提示完成特定任務),建立SFT模型;三,獎勵模型(對回應進行打分並相應調整權重);四,強化學習(在獎勵模型下不斷調整以獲得更高分數),最終獲得RLHF(人類反饋強化學習)模型。

 

【FOCUS】螺絲殼裏做道場,DeepSeek致勝啟示

DeepSeek依賴大規模強化學習(RL)訓練大模型,並將論文公開發表。

 

  DeepSeek則選擇跳過監督微調,而依賴大規模強化學習(RL),而這種方法允許模型自行探索思維鏈(CoT) ,以直接獲得更好表現。此外,DeepSeek採用MoE(混合專家)架構,即每個任務只激活相應的「專家(參數)」,意味顯著減少計算時間和算力需求。

 

借分享突破邊界吸引人才

 

  令人尤為驚訝的是,這兩大「殺手鐧」,DeepSeek都將相關研究論文--19頁《通過強化學習激勵大模型的推理能力》、33頁《在MoE語言模型中邁向終極專家專業化》經Arxiv學術平台公開分享。

 

  如此「慷慨」的原因何在?據DeepSeek自己的回答:「在快速發展的AI領域,合作和開放式的思想交流對於快速創新至關重要」,「是否擔心他人『趕上』並非主要考量,相反,重點在於突破可能的邊界,並分享這些進步,讓所有人受惠」,「通過分享研究成果,DeepSeek也能建立自己的思想領袖地位,並吸引人才和合作夥伴,以進一步實現其目標。」

 

【FOCUS】螺絲殼裏做道場,DeepSeek致勝啟示

鄭州連鎖餐廳靠免費派發低成本的氣球,做出了月租數萬元廣告牌沒有的效果。

 

  相比之下,名為「開放」的OpenAI拒絕如DeepSeek一樣開源,格局無疑小得多。聯想河南鄭州的一家連鎖餐廳,面對每月僅700元的廣告預算,靠免費派發每個成本僅幾毫子的氣球,做出了月租數萬元廣告牌沒有的效果,所謂「螺螄殼裏做道場」,即是不信邪、不拘泥地靈活變通,終能出奇制勝。

 

  那麼,Nvidia的神話有無結束?看看黃仁勳月初在「國際消費電子展CES 2025」上的展示,RTX 50 GPU、低價AI超級電腦Project Digits、人形機器人Cosmos……答案同樣是否。

 

撰文:金子安

送禮活動浪接浪!想緊貼著數活動消息?即Like etnet Facebook專頁!► 立即讚好

延伸閱讀

More
  • 道瓊斯工業平均指數
    升 44,525.62
    +103.71 (+0.233%)
  • 標準普爾500指數
    升 6,031.38
    +36.81 (+0.614%)
  • 納斯達克綜合指數
    升 19,615.43
    +223.47 (+1.152%)
精選預託證券 More
00700 騰訊控股
按盤價(HKD)︰升423.262
變動率︰+3.672%
較港股︰+0.59%
00388 香港交易所
按盤價(HKD)︰升312.321
變動率︰+2.408%
較港股︰+0.10%
02318 中國平安
按盤價(HKD)︰升44.152
變動率︰+1.704%
較港股︰+0.35%
01398 工商銀行
按盤價(HKD)︰升5.392
變動率︰+1.465%
較港股︰+0.04%
精選中資美股 More
PDD 拼多多
按盤價(USD)︰升113.820
變動率︰+8.153%
BIDU 百度
按盤價(USD)︰升92.760
變動率︰+5.758%
BILI 嗶哩嗶哩
按盤價(USD)︰升17.630
變動率︰+5.443%
IQ 愛奇藝
按盤價(USD)︰升2.195
變動率︰+5.024%
精選美股 More
SHOP
Shopify
按盤價(USD)︰升119.455
變動率︰+4.428%
MRNA
Moderna
按盤價(USD)︰跌33.920
變動率︰-7.196%
MRK
默沙東
按盤價(USD)︰跌90.925
變動率︰-8.884%
PYPL
貝寶
按盤價(USD)︰跌78.248
變動率︰-12.581%
美國指數之報價延遲最少15分鐘。
美股之報價延遲最少15分鐘。
美國時間為 : 04/02/2025 15:47 EST
港股之報價延遲最少15分鐘,更新時間為:04/02/2025 17:59
美國指數之報價延遲最少15分鐘。
美國時間為 : 04/02/2025 15:47 EST
顯示更多
緊貼市況
  • 02438 出門問問
  • 0.650
  • 01341 昊天國際建投
  • 0.820
  • 08349 硅鑫集團
  • 2.850
  • 08645 比特元宇宙
  • 0.660
  • 06666 恒大物業
  • 0.750
  • 00992 聯想集團
  • 10.520
  • 目標︰--
  • 00027 銀河娛樂
  • 31.050
  • 目標︰$38.00
  • 00497 資本策略地產
  • 0.079
  • 目標︰--
  • 00874 白雲山
  • 17.860
  • 目標︰--
  • 02727 上海電氣
  • 2.830
  • 目標︰$4.30
  • 09988 阿里巴巴-W
  • 97.650
  • 00700 騰訊控股
  • 420.800
  • 00020 商湯-W
  • 1.730
  • 03896 金山雲
  • 8.580
  • 00981 中芯國際
  • 45.450
  • 00354 中國軟件國際
  • 5.540
  • 目標︰$6.00
  • 06823 香港電訊-SS
  • 9.590
  • 目標︰$12.50
  • 03339 中國龍工
  • 1.650
  • 目標︰$2.00
  • 航運 More
  • 02343 太平洋航運
  • 1.630
  • 汽車 More
  • 09868 小鵬汽車-W
  • 65.700
品味生活
備註: 本地指數之報價為即時更新,資料更新時間為 04/02/2025 17:59
中國指數之報價為即時更新,資料更新時間為 27/01/2025 16:29
期指之報價為即時更新,資料更新時間為 05/02/2025 03:00
緊貼市況之報價延遲最少15分鐘,資料更新時間為 04/02/2025 16:40
港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站
放大顯示
精選影片
人氣文章
財經新聞
評論
專題
  • 生活
  • DIVA
  • 健康好人生
專業版
HV2
精裝版
SV2
串流版
IQ 登入
強化版
TQ
強化版
MQ

【etnet 30周年】多重慶祝活動一浪接一浪,好禮連環賞!

【蛇年行大運 新年好賞「飾」】etnet賞太歲開運趨吉避凶神器

etnet榮獲HKEX Awards 2023 「最佳證券數據供應商」大獎

大國博弈

貨幣攻略

說說心理話

聖誕新年特輯

Watch Trends 2024

北上食買玩

Art Month 2024

秋天養生食療

山今養生智慧

輕鬆護老