【FOCUS】開源模型再現黑馬,僅用「數千個」H800訓練
19/02/2025
DeepSeek橫空出世,徹底顛覆中美人工智能的「賽道規則」,低成本、全開源的新中國模式,故事遠未結束。就在周一(17日),位於上海的大模型獨角獸公司階躍星辰,發布全球參數最大(300億)的文字生成視頻開源模型Step-Video-T2V。效仿DeepSeek發表技術論文詳解訓練策略之餘,論文並透露,僅使用「數千個」性能相對較低的H800 GPU。
開源之風勁吹,馬斯克擬效仿
開源之風,愈吹愈勁。繼DeepSeek之後,百度下一版大模型Ernie 4.5已定於6月30日開源,剛剛推出自詡「地球上最聰明AI」Grok3大模型的馬斯克,放風可能在數個月後開源上一代Grok2。在此之前,OpenAI執行長Sam Altman上月罕有承認,在開源問題上站在了「歷史的錯誤一邊」,需制定新策略。
馬斯克放風可能在數個月後開源上一代Grok2。
這無疑印證了谷歌前執行長Eric Schmidt的擔憂,西方國家可能在全球頂尖技術開發的競賽中輸給中國,除非專注於建立開源AI模型。
一直以來,ChatGPT、Gemini、Claude、Grok等西方大模型不約而同選擇閉源,既是基於技術壟斷,更是基於商業利益。馬斯克早前透露,最新Grok3使用的英偉達GPU高達20萬個,訓練成本相當不菲。
換道超車,成就「三位一體」
相比閉源模型性能高度優化、穩定高效,開源意味在同樣參數規模下,更高成本、更慢速度的傳統認知,正被中國初創AI公司改寫。從DeepSeek據報只使用了2000至3000個H800 GPU開發出V3大模型,到階躍星辰自揭使用「數千個」H800 GPU訓練Step-Video-T2V大模型,都可謂是「換道」超車。
階躍星辰發布全球參數最大(300億)的文字生成視頻開源模型Step-Video-T2V。
階躍星辰同時開源的還有Step-Audio實時語音互動大模型,支持多種語言/方言的識別、對話、合成,模型參數高達1300億。
此低成本、全開源的前仆後繼,意味中國AI路線--文字/圖片/視頻/語音多模態兼容+AI Agent(智能體/AI代理)演進+開源接入多元生態,「三位一體」逐漸成形。高成本、閉源的「極致智能」,與低成本、開源的「實用應用」,哪個更有助解決人類社會全場景的業務問題?畢竟,追逐更尖端、更智能模型的終極目的,仍在於普惠眾生。
撰文:金子安
送禮活動浪接浪!想緊貼著數活動消息?即Like etnet Facebook專頁!► 立即讚好