《經濟通通訊社7日專訊》據《科創板日報》報道,「AI教母」李飛飛等斯丹福大學和華
盛頓大學的研究團隊,以不到50美元(約390港元)的雲計算費用,成功訓練出了一個名為
「s1」的人工智能推理模型。該模型在數學和編碼能力測試中的表現,據稱與OpenAI的
o1和DeepSeek的R1等尖端推理模型不相上下。
*利用阿里通義千問模型和谷歌Gemini模型*
報道指,經該報記者調查後發現,s1模型的訓練並非從零開始,其基座模型為阿里通義千
問(Qwen)模型。s1用50美元訓練出新的具有推理能力的模型,實際上只是用從谷歌模
型中提煉出來的1000個樣本,然後對千問模型進行微調而成。
科技資訊平台「量子位」的一篇文章介紹,簡單來說,該團隊以阿里通義團隊的
Qwen2﹒5- 32B-Instruct作為基礎模型,通過蒸餾
GoogleDeepMind的推理模型Gemini 2﹒0 Flash
Thinking實驗版,最終得到了s1模型。為訓練s1,該團隊創建了一個包含1000
個精心挑選的問題的數據集,且每個問題都附有答案,以及Gemini 2﹒0 Flash
Thinking實驗版的思考過程。目前,該項目論文《s1: Simple test
-time scaling》已經刊於論文預印本平台arXiv,模型s1也已在
GitHub上開源,研究團隊提供了訓練它的數據和代碼。
《新浪科技》則引述阿里雲方面確認,李飛飛等研究人員以阿里通義千問Qwen2﹒5-
32B-Instruct開源模型為底座,在16塊英偉達H100 GPU上監督微調26
分鐘,訓練出新模型s1-32B,取得了與OpenAI的o1和DeepSeek的R1等
尖端推理模型數學及編碼能力相當的效果,甚至在競賽數學問題上的表現比o1-
preview高出27%。(sl)
【強免疫‧抗病毒】3大健康法寶低至$88 (徇眾要求 優惠期延長至25年2月21日)► 了解詳情