【ＡＩ】螞蟻推出百靈輕量版、增強版，性能達行業領先水平

　　《經濟通通訊社２５日專訊》外電指螞蟻集團成功使用阿里及華為等國產芯片降低人工智能
（ＡＩ）模型訓練成本２０％，訓練出參數規模達２９００億的大模型「Ｌｉｎｇ－Ｐｌｕｓ」
。消息令業界振奮，但不能忽視的是同一份成果發表的另一項細節－－螞蟻集團憑藉這次低成本
訓練實驗推出了兩款不同規模的ＭｏＥ大語言模型－－百靈輕量版（Ｌｉｎｇ－Ｌｉｔｅ）與百
靈增強版（Ｌｉｎｇ－Ｐｌｕｓ），前者參數規模為１６８億（激活參數２７﹒５億），
Ｐｌｕｓ基座模型參數規模高達２９００億（激活參數２８８億），兩者性能均達到行業領先水
平。
　
　　據內媒《ＩＴ之家》報道，該份由螞蟻集團Ｌｉｎｇ團隊近日發表於論文預印版平台
Ａｒｘｉｖ的技術成果論文，題為《每一個ＦＬＯＰ都至關重要：無需高級ＧＰＵ即可擴展
３０００億參數混合專家ＬＩＮＧ大模型》。實驗表明，其３０００億參數的ＭｏＥ大模型可在
使用國產ＧＰＵ的低性能設備上完成高效訓練，性能與完全使用英偉達芯片、同規模的稠密模型
及ＭｏＥ模型相當。
　
　　當前，ＭｏＥ模型訓練通常依賴英偉達Ｈ１００╱Ｈ８００等高性能ＧＰＵ，成本高昂且芯
片短缺，限制了其在資源受限環境中的應用。螞蟻集團Ｌｉｎｇ團隊提出「不使用高級ＧＰＵ」
擴展模型的目標，通過創新訓練策略，突破資源與預算限制。在五種不同硬件配置下，Ｌｉｎｇ
團隊對９萬億個ｔｏｋｅｎ進行Ｌｉｎｇ－Ｐｌｕｓ預訓練。結果顯示，使用高性能硬件配置訓
練１萬億ｔｏｋｅｎ的預訓練成本約６３５萬元人民幣，而採用螞蟻優化方法後，低規格硬件訓
練成本降至５０８萬元左右，節省近２０％，且性能與阿里通義Ｑｗｅｎ２﹒５－７２Ｂ－
Ｉｎｓｔｒｕｃｔ和ＤｅｅｐＳｅｅｋ－Ｖ２﹒５－１２１０－Ｃｈａｔ相當。
　
　　報道指出，此前ＤｅｅｐＳｅｅｋ通過算法創新及工程優化，使用英偉達Ｈ８００訓練出性
能頂尖的Ｖ３與Ｒ１模型，為降低成本、提高效率開辟新道路。報道認為，螞蟻集團的技術成果
若得到驗證推廣，將助力國產大模型尋找成本更低、效率更高的國產芯片或其他替代方案，進一
步降低對英偉達芯片的依賴。（ｓｌ）

《說說心理話》遺體修復師分享入行過程！初入行有冇心理壓力？「無言老師」計劃推行初衷？► 即睇

大國博弈

美解封檔案大揭露，拉美難逃中情局劫網

貨幣攻略

高息定存 | 建行亞洲3個月特惠年利率5.68厘，大新低門檻...

說說心理話

備註：	即時報價更新時間為27/03/2025 18:00
	港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站