【ＡＩ】「ＡＩ教母」李飛飛團隊四百元復刻ＤｅｅｐＳｅｅｋＲ１

07/02/2025 10:09

　　《經濟通通訊社７日專訊》據《科創板日報》報道，「ＡＩ教母」李飛飛等斯丹福大學和華盛頓大學的研究團隊，以不到５０美元（約３９０港元）的雲計算費用，成功訓練出了一個名為「ｓ１」的人工智能推理模型。該模型在數學和編碼能力測試中的表現，據稱與ＯｐｅｎＡＩ的ｏ１和ＤｅｅｐＳｅｅｋ的Ｒ１等尖端推理模型不相上下。　＊利用阿里通義千問模型和谷歌Ｇｅｍｉｎｉ模型＊　　　報道指，經該報記者調查後發現，ｓ１模型的訓練並非從零開始，其基座模型為阿里通義千問（Ｑｗｅｎ）模型。ｓ１用５０美元訓練出新的具有推理能力的模型，實際上只是用從谷歌模型中提煉出來的１０００個樣本，然後對千問模型進行微調而成。　　　科技資訊平台「量子位」的一篇文章介紹，簡單來說，該團隊以阿里通義團隊的Ｑｗｅｎ２﹒５－　３２Ｂ－Ｉｎｓｔｒｕｃｔ作為基礎模型，通過蒸餾ＧｏｏｇｌｅＤｅｅｐＭｉｎｄ的推理模型Ｇｅｍｉｎｉ　２﹒０　Ｆｌａｓｈ　Ｔｈｉｎｋｉｎｇ實驗版，最終得到了ｓ１模型。為訓練ｓ１，該團隊創建了一個包含１０００個精心挑選的問題的數據集，且每個問題都附有答案，以及Ｇｅｍｉｎｉ　２﹒０　Ｆｌａｓｈ　Ｔｈｉｎｋｉｎｇ實驗版的思考過程。目前，該項目論文《ｓ１：　Ｓｉｍｐｌｅ　ｔｅｓｔ－ｔｉｍｅ　ｓｃａｌｉｎｇ》已經刊於論文預印本平台ａｒＸｉｖ，模型ｓ１也已在ＧｉｔＨｕｂ上開源，研究團隊提供了訓練它的數據和代碼。　　　《新浪科技》則引述阿里雲方面確認，李飛飛等研究人員以阿里通義千問Ｑｗｅｎ２﹒５－３２Ｂ－Ｉｎｓｔｒｕｃｔ開源模型為底座，在１６塊英偉達Ｈ１００　ＧＰＵ上監督微調２６分鐘，訓練出新模型ｓ１－３２Ｂ，取得了與ＯｐｅｎＡＩ的ｏ１和ＤｅｅｐＳｅｅｋ的Ｒ１等尖端推理模型數學及編碼能力相當的效果，甚至在競賽數學問題上的表現比ｏ１－ｐｒｅｖｉｅｗ高出２７％。（ｓｌ）

送禮活動浪接浪！想緊貼著數活動消息？即Like etnet Facebook專頁！► 立即讚好

【ＡＩ】「ＡＩ教母」李飛飛團隊四百元復刻ＤｅｅｐＳｅｅｋＲ１

《中資異動》金蝶國際等２家公司上午１０：１８異動 07/02/2025 10:19

【高息定存】ＰＡＯｂａｎｋ一個月港元定期存款高達８厘 07/02/2025 10:07

其他相關新聞

《出旗制勝－麥穎儀》資金流入平保牛證，小米續破頂 07/02/2025 10:45

中海油（００８８３）：渤中２６－６油田開發項目（一期）投產 07/02/2025 10:22

《異動股》聯想集團低開後復升９％，蛇年開市５日股價累升３５％ 07/02/2025 10:21

《異動股》比亞迪升逾３％強勢破頂，下周一發布智駕新進展 07/02/2025 10:02

《異動股》小米飆半成破頂，小米眼鏡設微博帳號引遐想，公關否認 07/02/2025 10:00