• |
  • 極速報價
  • |
  • etnet專輯
    etnet專輯
  • 會員
  • 產品服務 / 串流版
  • 設定

19/02/2025

【FOCUS】開源模型再現黑馬,僅用「數千個」H800訓練

  • 加入最愛專欄
  • 收藏文章

  DeepSeek橫空出世,徹底顛覆中美人工智能的「賽道規則」,低成本、全開源的新中國模式,故事遠未結束。就在周一(17日),位於上海的大模型獨角獸公司階躍星辰,發布全球參數最大(300億)的文字生成視頻開源模型Step-Video-T2V。效仿DeepSeek發表技術論文詳解訓練策略之餘,論文並透露,僅使用「數千個」性能相對較低的H800 GPU。

 

開源之風勁吹,馬斯克擬效仿

 

  開源之風,愈吹愈勁。繼DeepSeek之後,百度下一版大模型Ernie 4.5已定於6月30日開源,剛剛推出自詡「地球上最聰明AI」Grok3大模型的馬斯克,放風可能在數個月後開源上一代Grok2。在此之前,OpenAI執行長Sam Altman上月罕有承認,在開源問題上站在了「歷史的錯誤一邊」,需制定新策略。

 

【FOCUS】開源模型再現黑馬,僅用「數千個」H800訓練

馬斯克放風可能在數個月後開源上一代Grok2。

 

  這無疑印證了谷歌前執行長Eric Schmidt的擔憂,西方國家可能在全球頂尖技術開發的競賽中輸給中國,除非專注於建立開源AI模型。

 

  一直以來,ChatGPT、Gemini、Claude、Grok等西方大模型不約而同選擇閉源,既是基於技術壟斷,更是基於商業利益。馬斯克早前透露,最新Grok3使用的英偉達GPU高達20萬個,訓練成本相當不菲。

 

換道超車,成就「三位一體」

 

  相比閉源模型性能高度優化、穩定高效,開源意味在同樣參數規模下,更高成本、更慢速度的傳統認知,正被中國初創AI公司改寫。從DeepSeek據報只使用了2000至3000個H800 GPU開發出V3大模型,到階躍星辰自揭使用「數千個」H800 GPU訓練Step-Video-T2V大模型,都可謂是「換道」超車。

 

【FOCUS】開源模型再現黑馬,僅用「數千個」H800訓練

階躍星辰發布全球參數最大(300億)的文字生成視頻開源模型Step-Video-T2V。

 

  階躍星辰同時開源的還有Step-Audio實時語音互動大模型,支持多種語言/方言的識別、對話、合成,模型參數高達1300億。

 

  此低成本、全開源的前仆後繼,意味中國AI路線--文字/圖片/視頻/語音多模態兼容+AI Agent(智能體/AI代理)演進+開源接入多元生態,「三位一體」逐漸成形。高成本、閉源的「極致智能」,與低成本、開源的「實用應用」,哪個更有助解決人類社會全場景的業務問題?畢竟,追逐更尖端、更智能模型的終極目的,仍在於普惠眾生。

撰文:金子安

 

【你點睇?】馬斯克劍指美國國家民主基金會(NED),籲網民找出「罪證」。你認為若NED遭關閉,是否可促進全球和平穩定?► 立即投票

我要回應

你可能感興趣

版主留言

放大顯示
精選影片
最緊要健康
精選文章
  • 生活
  • DIVA
  • 健康好人生
專業版
HV2
精裝版
SV2
串流版
IQ 登入
強化版
TQ
強化版
MQ