2025-02-21
Grok-3橫空出世!馬斯克xAI新模型擁龐大運算資源+超強推理力,能否撼動OpenAI領先地位?
繼DeepSeek R-1後,全球首富馬斯克旗下AI初創xAI,也發表了具有思考推理能力的AI模型「Grok-3」。xAI宣稱,在數學、科學、編程三大基準測試中,Grok-3表現超越包括OpenAI GPT-o4在內的既有模型;馬斯克更豪言,它是「地球上最聰明的AI模型」。究竟這家成立不到兩年的初創,技術上是否已追上領頭羊OpenAI?Grok-3的出現對AI市場競爭又會帶來甚麼影響?
Read More
ChatGPT強敵再現!馬斯克AI模型Grok能力超越GPT-3.5!有幽默感,甚麼問題都願意答!
馬斯克、奧特曼恩怨情仇:從合作創業到對簿公堂!狀告OpenAI勝算不高,為何馬斯克還要提告?
xAI一年半內推出三代AI模型
伊隆·馬斯克(Elon Musk)於2023年7月創立xAI,擺明車馬是要挑戰OpenAI;同年11月,已推出第一代Grok,可見其研發能之強。Grok使用馬斯克旗下社交媒體平台X(前稱Twitter)的貼文進行數據訓練;回覆用戶問題時,更即時從X平台上尋找相關貼文來生成答案,這使得它能快速回應時事問題,甚至回答其他AI避之不及的敏感話題,展現出與眾不同的「叛逆」個性。
Grok-3網上直播發表會開首的背景上,顯示xAI的使命是「了解宇宙」。(翻攝X.com@xai的官方影片)
2024年3月,xAI釋出初代模型的強化版Grok 1.5,訓練數據量增加至3,140億項參數;同年8月推出第二代模型Grok 2,兼具圖像與文本生成能力。沉寂半年後,xAI於2025年2月18日透過網上直播發表第三代模型Grok-3,最高峰時有超過200萬人同時觀看。
Grok-3提供4個不同版本模型
在創建模型的首階段,xAI使用內置10萬顆NVIDIA H100晶片的超級電腦Colossus,花了122天製造出Grok-3基礎模型;進入第二階段,xAI再花92天,將Colossus的AI晶片倍增至20萬顆,進一步提升Grok-3的運算力。馬斯克表示,Grok-3透過大量合成數據進行訓練,懂得不斷反省思考和修正錯誤,以提高邏輯一致性。
Grok-3採用多模型架構,設有4個不同版本:基本版的Grok-3、較小版本的Grok-3 mini、具思考推理能力的Grok-3 Reasoning、以及較小型的推理模型Grok-3 mini Reasoning。根據xAI的內部測試,Grok-3在數學推理(AIME高中競賽數學標準)、科學知識(包含博士級試題)、編程能力(LeetCode編程練習題)上,表現均優於OpenAI GPT-4o、Google Gemini 2 Pro、Claude 3.5 Sonnet、以及DeepSeek-V3。
兼具即時思考與自主創作能力
除基準測成績優異外,Grok-3還具備即時思考與自主創作能力。在網上直播中,xAI團隊要求Grok-3繪製一幅3D動畫圖,模擬火箭從地球升空、降落火星,並在下個發射窗口返回地球。xAI懂得將複雜任務分拆成較小的步驟,逐步思考推理,以得出更有邏輯的答案,並且容許用戶即時查看其推理步驟。
在直播發表會上,Grok-3即場生成了一幅模擬火箭從地球往返火星的3D動畫圖。(翻攝X.com@xai的官方影片)
xAI團隊又即場指示Grok-3設計一款新遊戲,要兼具俄羅斯方塊(Tetris)與寶石方塊(Bejeweled)的遊戲特色。一般生成式AI或許會把這兩款經典遊戲的設計元素,硬生生塞進新作品中就了事,惟Grok-3卻能真正理解兩款遊戲的核心機制,再將兩者相互結合,創造出一款全新遊戲。馬斯克表示,日後xAI將成立一家AI遊戲公司,在Grok的協助下要讓遊戲再次偉大。
Grok-3迫使對手加速研發進程
馬斯克研發Grok的野心,當然不止於遊戲開發。其實,他創辦xAI的主要目標,就是要了解宇宙。他揚言,假如一切順利,SpaceX Starship將於2026年將搭載Grok與Optimus機械人,飛往火星進行探索。
OpenAI共同創辦人、電腦科學家安德烈·卡帕西(Andrej Karpathy)在試用Grok-3後表示,Grok-3 Reasoning的推理表現跟OpenAI o1-Pro相當,比起Gemini 2.0 Flash Thinking與DeepSeek-R1則略勝一籌。
Grok-3又即席創造了一款融合俄羅斯方塊與寶石方塊的全新遊戲。(翻攝X.com@xai的官方影片)
Grok-3展示的優異性能,將迫使競爭對手加速研發進程,推出更強大模型以應對挑戰。在Grok-3發布前的數小時,OpenAI執行長山姆·奧特曼(Sam Altman)突然宣布,GPT-4.5已進入測試階段,又表示對高要求的測試人員而言,試用GPT-4.5帶來的體驗遠超他們預期,暗示其表現已接近通用人工智能(AGI)的境界。此舉被外界解讀為,奧特曼對Grok-3的狙擊。
Grok-3刺激AI晶片市場增長
再者,Grok-3的出現,亦證明了AI產業仍需要先進AI晶片提供強大運算力,有望將進一步刺激AI晶片的市場增長。xAI表示,考慮把Grok-3的運算資源擴大5倍,並已跟戴爾(Dell)洽談價值50億美元(約390億港元)的伺服器供貨協議,預計2025年內將向xAI供應內含NVIDIA GB200晶片的伺服器。
此外,投資人開始相信,DeepSeek帶來的低運算力威脅是被誇大了,近日市場上不斷出現增加AI 支出的新計劃。歐盟委員會在2月中舉行的AI行動高峰會上公布,擬投入2,000億歐元(約1.63兆港元)來興建AI基礎設施。法國總統馬克龍也宣布,未來幾年將投資1,090億歐元(約8,888億港元)推動法國AI發展。目前輝達(NVIDIA)股價已收復失地,差不多回升至原先價位;業界估計,AI伺服器需求將持續至2025年底,對全球AI產業鏈形成顯著的正向效應。
現時X平台用戶可以免費使用Grok-3,但如卻使用更高階的AI功能,就要升級為Premium+付費訂戶,月費為32.92美元(約255.83港元)。(翻攝X.com@xai的官方影片)
Grok-3免費開放給所有X用戶
由是觀之,Grok-3已成為吹皺一池春水的狂風,令AI競爭進入更白熱化的階段。OpenAI GPT-4.5看似箭在弦上,隨時準備出擊;至於Google、Anthropic、DeepSeek等,也有可能在未來幾個月內釋出更強大的AI模型。
Grok-3要在新一輪AI競賽中跑出,不能單靠強大的運算資源和優異的推理能力,勝負關鍵在於用戶使用體驗和迭代更新速度。xAI表示,Grok 3稍後會推出語音模式,讓用戶只需張嘴說話,即可跟AI互動;之後會開放API介面,讓開發者可以將Grok-3的推理能力和語音功能,整合到自家應用軟件。該公司承諾,將在幾個月內公開上代Grok-2的原始碼,以延續其開源策略。
後來馬斯克索性宣布,Grok-3將限時免費開放給所有X平台用戶,直至伺服器無法負荷為止。如此一來,X平台上逾5.85億網民,即時變成Grok-3的使用者,讓AI用戶基數在短時間內得以大幅飇升,而且又可以幫助X平台吸納更多新用戶,確是一箭雙雕的妙計。
《經濟通》所刊的署名及/或不署名文章,相關內容屬作者個人意見,並不代表《經濟通》立場,《經濟通》所扮演的角色是提供一個自由言論平台。
【你點睇?】美國總統特朗普批評烏克蘭總統澤連斯基是「一位未經選舉的獨裁者」,俄烏戰爭早應停止。你是否認同特朗普的說法?► 立即投票