19/02/2025

【FOCUS】開源模型再現黑馬，僅用「數千個」H800訓練

#開源 #百度 #DeepSeek #英偉達 #馬斯克 #人工智能 #階躍星辰 #Grok3 #大模型 #AI

加入最愛專欄
收藏文章

　　DeepSeek橫空出世，徹底顛覆中美人工智能的「賽道規則」，低成本、全開源的新中國模式，故事遠未結束。就在周一（17日），位於上海的大模型獨角獸公司階躍星辰，發布全球參數最大（300億）的文字生成視頻開源模型Step-Video-T2V。效仿DeepSeek發表技術論文詳解訓練策略之餘，論文並透露，僅使用「數千個」性能相對較低的H800 GPU。

開源之風勁吹，馬斯克擬效仿

　　開源之風，愈吹愈勁。繼DeepSeek之後，百度下一版大模型Ernie 4.5已定於6月30日開源，剛剛推出自詡「地球上最聰明AI」Grok3大模型的馬斯克，放風可能在數個月後開源上一代Grok2。在此之前，OpenAI執行長Sam Altman上月罕有承認，在開源問題上站在了「歷史的錯誤一邊」，需制定新策略。

【FOCUS】開源模型再現黑馬，僅用「數千個」H800訓練

馬斯克放風可能在數個月後開源上一代Grok2。

　　這無疑印證了谷歌前執行長Eric Schmidt的擔憂，西方國家可能在全球頂尖技術開發的競賽中輸給中國，除非專注於建立開源AI模型。

　　一直以來，ChatGPT、Gemini、Claude、Grok等西方大模型不約而同選擇閉源，既是基於技術壟斷，更是基於商業利益。馬斯克早前透露，最新Grok3使用的英偉達GPU高達20萬個，訓練成本相當不菲。

換道超車，成就「三位一體」

　　相比閉源模型性能高度優化、穩定高效，開源意味在同樣參數規模下，更高成本、更慢速度的傳統認知，正被中國初創AI公司改寫。從DeepSeek據報只使用了2000至3000個H800 GPU開發出V3大模型，到階躍星辰自揭使用「數千個」H800 GPU訓練Step-Video-T2V大模型，都可謂是「換道」超車。

【FOCUS】開源模型再現黑馬，僅用「數千個」H800訓練

階躍星辰發布全球參數最大（300億）的文字生成視頻開源模型Step-Video-T2V。

　　階躍星辰同時開源的還有Step-Audio實時語音互動大模型，支持多種語言/方言的識別、對話、合成，模型參數高達1300億。

　　此低成本、全開源的前仆後繼，意味中國AI路線－－文字/圖片/視頻/語音多模態兼容+AI Agent（智能體/AI代理）演進+開源接入多元生態，「三位一體」逐漸成形。高成本、閉源的「極致智能」，與低成本、開源的「實用應用」，哪個更有助解決人類社會全場景的業務問題？畢竟，追逐更尖端、更智能模型的終極目的，仍在於普惠眾生。

撰文:金子安

【你點睇？】馬斯克劍指美國國家民主基金會（NED），籲網民找出「罪證」。你認為若NED遭關閉，是否可促進全球和平穩定？► 立即投票