• 恒指
  • 21,134
  • +242
  •  大市成交 2,464億
  • 期指
  • 21,220
  • +283
  • 高水86
  • 國指
  • 7,784
  • +94
  • 紅籌
  • 3,638
  • +12
  • 科指
  • 5,150
  • +91
  • 上證
  • 3,304
  • +33
  •  成交 7,576億
07/02/2025 10:09

【AI】「AI教母」李飛飛團隊四百元復刻DeepSeekR1

  《經濟通通訊社7日專訊》據《科創板日報》報道,「AI教母」李飛飛等斯丹福大學和華盛頓大學的研究團隊,以不到50美元(約390港元)的雲計算費用,成功訓練出了一個名為「s1」的人工智能推理模型。該模型在數學和編碼能力測試中的表現,據稱與OpenAI的o1和DeepSeek的R1等尖端推理模型不相上下。 *利用阿里通義千問模型和谷歌Gemini模型*   報道指,經該報記者調查後發現,s1模型的訓練並非從零開始,其基座模型為阿里通義千問(Qwen)模型。s1用50美元訓練出新的具有推理能力的模型,實際上只是用從谷歌模型中提煉出來的1000個樣本,然後對千問模型進行微調而成。   科技資訊平台「量子位」的一篇文章介紹,簡單來說,該團隊以阿里通義團隊的Qwen2﹒5- 32B-Instruct作為基礎模型,通過蒸餾GoogleDeepMind的推理模型Gemini 2﹒0 Flash Thinking實驗版,最終得到了s1模型。為訓練s1,該團隊創建了一個包含1000個精心挑選的問題的數據集,且每個問題都附有答案,以及Gemini 2﹒0 Flash Thinking實驗版的思考過程。目前,該項目論文《s1: Simple test-time scaling》已經刊於論文預印本平台arXiv,模型s1也已在GitHub上開源,研究團隊提供了訓練它的數據和代碼。   《新浪科技》則引述阿里雲方面確認,李飛飛等研究人員以阿里通義千問Qwen2﹒5-32B-Instruct開源模型為底座,在16塊英偉達H100 GPU上監督微調26分鐘,訓練出新模型s1-32B,取得了與OpenAI的o1和DeepSeek的R1等尖端推理模型數學及編碼能力相當的效果,甚至在競賽數學問題上的表現比o1-preview高出27%。(sl)

送禮活動浪接浪!想緊貼著數活動消息?即Like etnet Facebook專頁!► 立即讚好

備註︰

即時報價更新時間為 07/02/2025 16:50

港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站

權證
即時報價
全文搜索
Search
最近搜看
貨幣攻略
大國博弈
More
Share