【ＡＩ】阿里雲魔搭社區首發階躍星辰最新兩款開源多模態模型

　　《經濟通通訊社２１日專訊》今起一連３天在上海舉行的全球開發者先鋒大會（ＧＤＣ）上
，阿里雲魔搭社區首發階躍星辰最新開源的兩款多模態模型，包括基於３００億參數、全球參數
量最大的開源視頻生成模型Ｓｔｅｐ－Ｖｉｄｅｏ－Ｔ２Ｖ，以及業界首款產品級開源語音交互
模型Ｓｔｅｐ－Ａｕｄｉｏ，而這兩款模型是近期全球多模態領域最熱門的開源模型。目前魔搭
社區已上架超過４萬個開源模型，涵蓋ＬＬＭ、對話、語音、文生圖、圖生視頻等多個領域，是
中國最大的ＡＩ模型社區。
　
　　總部位於上海的大模型初創公司階躍星辰是「中國ＡＩ六小虎」之一，也是吉利的生態戰略
合作夥伴。在Ｓｔｅｐ－Ｖｉｄｅｏ－Ｔ２Ｖ和Ｓｔｅｐ－Ａｕｄｉｏ開發過程中，雙方深度合
作，在算力算法、場景訓練等領域優勢互補，顯著增強了多模態大模型的性能表現。雙方近日聯
合宣布將這兩款模型向全球開發者開源，推動ＡＩ視頻創作普惠化。目前吉利自研星睿大模型已
與這兩款模型完成融合，而這兩款開源模型亦將上線階躍星辰的Ａｐｐ「躍問」。
　
　　據介紹，Ｓｔｅｐ－Ｖｉｄｅｏ－Ｔ２Ｖ是基於３００億參數的文本轉視頻預訓練模型，能
夠生成高達２０４幀的視頻，在指令遵循、運動平滑性、物理合理性、美感度等方面表現均顯著
超過市面上既有的開源視頻模型。
　
　　Ｓｔｅｐ－Ａｕｄｉｏ是業界首個產品級開源語音模型，參數規模多達１３００多億。根據
Ｌｌａｍａ　Ｑｕｅｓｔｉｏｎ等５大主流公開測試，Ｓｔｅｐ－Ａｕｄｉｏ模型性能均位列第
一，並在ＨＳＫ－６（漢語水平考試六級）的測評中表現尤佳。（ｓｌ）

《說說心理話》親友自殺離世遺屬如何自處？身邊親友應該怎樣陪他們走出人生最低谷？► 即睇

大國博弈

特馬發動「革命」，激進易起反噬？

2025-26年度財政預算案

預算前瞻 | 畢馬威料港府在2024/25年度錄897億元赤...

貨幣攻略

高息定存 | 一周高息合集，減息預期降溫，銀行3個月最高5....

說說心理話

備註：	即時報價更新時間為21/02/2025 17:59
	港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站