【ＡＩ】「ＡＩ教母」李飛飛團隊四百元復刻ＤｅｅｐＳｅｅｋＲ１

　　《經濟通通訊社７日專訊》據《科創板日報》報道，「ＡＩ教母」李飛飛等斯丹福大學和華
盛頓大學的研究團隊，以不到５０美元（約３９０港元）的雲計算費用，成功訓練出了一個名為
「ｓ１」的人工智能推理模型。該模型在數學和編碼能力測試中的表現，據稱與ＯｐｅｎＡＩ的
ｏ１和ＤｅｅｐＳｅｅｋ的Ｒ１等尖端推理模型不相上下。
　
＊利用阿里通義千問模型和谷歌Ｇｅｍｉｎｉ模型＊
　
　　報道指，經該報記者調查後發現，ｓ１模型的訓練並非從零開始，其基座模型為阿里通義千
問（Ｑｗｅｎ）模型。ｓ１用５０美元訓練出新的具有推理能力的模型，實際上只是用從谷歌模
型中提煉出來的１０００個樣本，然後對千問模型進行微調而成。
　
　　科技資訊平台「量子位」的一篇文章介紹，簡單來說，該團隊以阿里通義團隊的
Ｑｗｅｎ２﹒５－　３２Ｂ－Ｉｎｓｔｒｕｃｔ作為基礎模型，通過蒸餾
ＧｏｏｇｌｅＤｅｅｐＭｉｎｄ的推理模型Ｇｅｍｉｎｉ　２﹒０　Ｆｌａｓｈ　
Ｔｈｉｎｋｉｎｇ實驗版，最終得到了ｓ１模型。為訓練ｓ１，該團隊創建了一個包含１０００
個精心挑選的問題的數據集，且每個問題都附有答案，以及Ｇｅｍｉｎｉ　２﹒０　Ｆｌａｓｈ
　Ｔｈｉｎｋｉｎｇ實驗版的思考過程。目前，該項目論文《ｓ１：　Ｓｉｍｐｌｅ　ｔｅｓｔ
－ｔｉｍｅ　ｓｃａｌｉｎｇ》已經刊於論文預印本平台ａｒＸｉｖ，模型ｓ１也已在
ＧｉｔＨｕｂ上開源，研究團隊提供了訓練它的數據和代碼。
　
　　《新浪科技》則引述阿里雲方面確認，李飛飛等研究人員以阿里通義千問Ｑｗｅｎ２﹒５－
３２Ｂ－Ｉｎｓｔｒｕｃｔ開源模型為底座，在１６塊英偉達Ｈ１００　ＧＰＵ上監督微調２６
分鐘，訓練出新模型ｓ１－３２Ｂ，取得了與ＯｐｅｎＡＩ的ｏ１和ＤｅｅｐＳｅｅｋ的Ｒ１等
尖端推理模型數學及編碼能力相當的效果，甚至在競賽數學問題上的表現比ｏ１－
ｐｒｅｖｉｅｗ高出２７％。（ｓｌ）

《說說心理話》親友自殺離世遺屬如何自處？身邊親友應該怎樣陪他們走出人生最低谷？► 即睇

2025-26年度財政預算案

財政預算案 | ACCA倡2元乘車優惠由劃一資助改為分級補貼...

大國博弈

波羅的海三國在「脫俄之路」上又邁出一步

貨幣攻略

高息定存 | 一周高息合集，蛇年定存金蛇起舞，1個月定存高達...

說說心理話

備註：	即時報價更新時間為11/02/2025 16:14
	港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站