67944 恒指法巴八九牛D (R 牛證)
即時 按盤價 跌0.186 -0.017 (-8.374%)

07/02/2025 10:09

【AI】「AI教母」李飛飛團隊四百元復刻DeepSeekR1

  《經濟通通訊社7日專訊》據《科創板日報》報道,「AI教母」李飛飛等斯丹福大學和華
盛頓大學的研究團隊,以不到50美元(約390港元)的雲計算費用,成功訓練出了一個名為
「s1」的人工智能推理模型。該模型在數學和編碼能力測試中的表現,據稱與OpenAI的
o1和DeepSeek的R1等尖端推理模型不相上下。
 
*利用阿里通義千問模型和谷歌Gemini模型*
 
  報道指,經該報記者調查後發現,s1模型的訓練並非從零開始,其基座模型為阿里通義千
問(Qwen)模型。s1用50美元訓練出新的具有推理能力的模型,實際上只是用從谷歌模
型中提煉出來的1000個樣本,然後對千問模型進行微調而成。
 
  科技資訊平台「量子位」的一篇文章介紹,簡單來說,該團隊以阿里通義團隊的
Qwen2﹒5- 32B-Instruct作為基礎模型,通過蒸餾
GoogleDeepMind的推理模型Gemini 2﹒0 Flash 
Thinking實驗版,最終得到了s1模型。為訓練s1,該團隊創建了一個包含1000
個精心挑選的問題的數據集,且每個問題都附有答案,以及Gemini 2﹒0 Flash
 Thinking實驗版的思考過程。目前,該項目論文《s1: Simple test
-time scaling》已經刊於論文預印本平台arXiv,模型s1也已在
GitHub上開源,研究團隊提供了訓練它的數據和代碼。
 
  《新浪科技》則引述阿里雲方面確認,李飛飛等研究人員以阿里通義千問Qwen2﹒5-
32B-Instruct開源模型為底座,在16塊英偉達H100 GPU上監督微調26
分鐘,訓練出新模型s1-32B,取得了與OpenAI的o1和DeepSeek的R1等
尖端推理模型數學及編碼能力相當的效果,甚至在競賽數學問題上的表現比o1-
preview高出27%。(sl)

《說說心理話》親友自殺離世遺屬如何自處?身邊親友應該怎樣陪他們走出人生最低谷?► 即睇

備註: 即時報價更新時間為11/02/2025 16:14
  港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站
專業版
HV2
精裝版
SV2
串流版
IQ 登入
強化版
TQ
強化版
MQ

【etnet 30周年】多重慶祝活動一浪接一浪,好禮連環賞!

【蛇年行大運 新年好賞「飾」】etnet賞太歲開運趨吉避凶神器

etnet榮獲HKEX Awards 2023 「最佳證券數據供應商」大獎

2025-26年度財政預算案

大國博弈

貨幣攻略

說說心理話

聖誕新年特輯

Watch Trends 2024

北上食買玩

Art Month 2024

流感高峰期

山今養生智慧

輕鬆護老