《經濟通通訊社28日專訊》內地私募巨頭幻方量化孵化的AI初創企業DeepSeek
異軍突起,一個月內接連發布兩個以低成本和強大性能震撼矽谷的開源大模型DeepSeek
-V3和DeepSeek-R1後,今日凌晨乘勝追擊,再發布開源多模態AI模型
Janus-Pro和JanusFlow,為用家提供極簡但強大的多模態解決方案。
DeepSeek一出手,科技界抖三抖。DeepSeek的V3和R1大模型開發成本
以及所需的英偉達晶片據報遠少於ChatGPT等競爭對手,性能卻媲美OpenAI的o1
,甚至超越Meta的Llama。已被冠以「AI界拼多多」之名的DeepSeek,儼然
成為訓練成本動輒數十億美元AI大廠的最大「威脅」,也令市場憂慮AI企業未來將不需要大
量晶片和數據中心資源。
*幻方量化曾是唯一規模過千億量化私募*
這家2023年7月才成立的AI企業,其崛起之路或許少不了幻方量化龐大資金支持。
DeepSeek--杭州深度求索人工智能基礎技術研究有限公司實際控制人是現年40歲的
幻方量化聯合創辦人梁文鋒,其本科、研究生均就讀於浙江大學,擁有信息與電子工程學系本科
和碩士學位。2008年攻讀碩士期間,梁文鋒就與同學組建團隊收集金融市場等相關數據,並
帶領團隊使用機器學習等技術探索全自動量化交易。
2015年,幻方量化正式成立。2016年10月,幻方量化推出第一個AI模型,第一
份由深度學習生成的交易倉位上線執行,到2017年底,公司幾乎所有量化策略都採用AI模
型計算。2019年,幻方量化管理規模突破百億,成為內地量化私募「四巨頭」之一。此後幻
方量化甚至一度成為中國首家突破千億的私募量化大廠,也是迄今為止業內唯一規模曾邁過千億
大關的量化私募。不過,2021年9月後,幻方量化的業績大倒退,管理規模亦逐漸縮水。
*AI熱潮下進軍AGI領域,一年多發布多個強大模型*
2023年,全球人工智能熱潮爆發,以強大的算力支持而聞名的幻方量化也宣布集中資源
和力量成立DeepSeek,進軍通用人工智能(AGI)領域。同年11月,
DeepSeek第一代大模型DeepSeek Coder面世,免費商用,完全開源。當
時DeepSeek表示,這可能是最強開源代碼大模型。2024年5月,混合專家模型
DeepSeek-V2面世;同年6月,基於DeepSeek-V2的DeepSeek-
Coder-V2模型正式開源,相關評測榜單顯示這是全球首個在代碼、數學能力上超越
GPT-4-Turbo、Claude3-Opus、Gemini-1﹒5Pro等的開源
代碼大模型。同年12月26日,DeepSeek-V3發布。今年1月20日,
DeepSeek-R1發布。
有內媒引述一名AI算法工程師指出,「在豆包和阿里雲之前,DeepSeek最先在全
網降低了模型成本」,這讓他印象非常深刻。
*多項政策支持國家建設科技強國、發展AI*
DeepSeek光速發展相信也不乏政策支持。國家主席習近平提出要建設科技強國,並
多次強調要加快實現高水平科技自立自強,又稱中國式現代化要由科學技術打頭陣,「科技創新
是必由之路」。人民銀行、財政部、科技部等部門和各地地方政府對高新技術企業都有相關支持
和補貼政策,包括科技創新再貸款、稅收優惠、人才補貼、研發費用補貼等。
值得留意的是,梁文鋒已經成為科技界代表人物之一。據官媒《新華社》等報道,國務院總
理李強1月20日主持召開專家、企業家和教科文衛體等領域代表座談會,聽取對《政府工作報
告(徵求意見稿)》的意見建議,梁文鋒有份出席並發言。這一天正是DeepSeek-R1
發布之日。
在2024年的《政府工作報告》中,3次提到了「人工智能」,還首次提出開展「人工智
能+」行動。隨後中央陸續出台了一系列支持人工智能產業發展的政策。座談會上,李強提到,
「要以科技創新推動新舊動能轉換,集中力量突破關鍵核心技術和前沿技術,加快推進科技成果
產業化,努力培育更多經濟新增長點」。(sl)
【你點睇?】高拔陞指醫管局將採購內地醫療儀器配合政府節流,你是否支持?► 立即投票