28151 恒指摩利五四沽B (認沽證)
即時 按盤價 跌0.056 -0.005 (-8.197%)

07/02/2025 10:09

【AI】「AI教母」李飛飛團隊四百元復刻DeepSeekR1

  《經濟通通訊社7日專訊》據《科創板日報》報道,「AI教母」李飛飛等斯丹福大學和華
盛頓大學的研究團隊,以不到50美元(約390港元)的雲計算費用,成功訓練出了一個名為
「s1」的人工智能推理模型。該模型在數學和編碼能力測試中的表現,據稱與OpenAI的
o1和DeepSeek的R1等尖端推理模型不相上下。
 
*利用阿里通義千問模型和谷歌Gemini模型*
 
  報道指,經該報記者調查後發現,s1模型的訓練並非從零開始,其基座模型為阿里通義千
問(Qwen)模型。s1用50美元訓練出新的具有推理能力的模型,實際上只是用從谷歌模
型中提煉出來的1000個樣本,然後對千問模型進行微調而成。
 
  科技資訊平台「量子位」的一篇文章介紹,簡單來說,該團隊以阿里通義團隊的
Qwen2﹒5- 32B-Instruct作為基礎模型,通過蒸餾
GoogleDeepMind的推理模型Gemini 2﹒0 Flash 
Thinking實驗版,最終得到了s1模型。為訓練s1,該團隊創建了一個包含1000
個精心挑選的問題的數據集,且每個問題都附有答案,以及Gemini 2﹒0 Flash
 Thinking實驗版的思考過程。目前,該項目論文《s1: Simple test
-time scaling》已經刊於論文預印本平台arXiv,模型s1也已在
GitHub上開源,研究團隊提供了訓練它的數據和代碼。
 
  《新浪科技》則引述阿里雲方面確認,李飛飛等研究人員以阿里通義千問Qwen2﹒5-
32B-Instruct開源模型為底座,在16塊英偉達H100 GPU上監督微調26
分鐘,訓練出新模型s1-32B,取得了與OpenAI的o1和DeepSeek的R1等
尖端推理模型數學及編碼能力相當的效果,甚至在競賽數學問題上的表現比o1-
preview高出27%。(sl)

【你點睇?】美國指對華加徵10%關稅同樣適用於香港,你認為措施會否打擊本港轉口港地位?► 立即投票

備註: 即時報價更新時間為07/02/2025 14:24
  港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站
專業版
HV2
精裝版
SV2
串流版
IQ 登入
強化版
TQ
強化版
MQ

【etnet 30周年】多重慶祝活動一浪接一浪,好禮連環賞!

【蛇年行大運 新年好賞「飾」】etnet賞太歲開運趨吉避凶神器

etnet榮獲HKEX Awards 2023 「最佳證券數據供應商」大獎

大國博弈

貨幣攻略

說說心理話

聖誕新年特輯

Watch Trends 2024

北上食買玩

Art Month 2024

流感高峰期

山今養生智慧

輕鬆護老