馬斯克宣布一月連發兩款萬億模型,并直接給狂飆的Grok 5蓋上了AGI的終極印章。
4月底的AI圈,被一條推文炸開了鍋。
馬斯克在X平臺上寫道:“Grok 5就是AGI。”沒有“可能”,沒有“也許”,甚至沒有附上一份技術報告。這很馬斯克——用最少的文字,撬動最大的爭論。
![]()
緊隨其后的,是xAI一份讓整個硅谷側目的路線圖:一個月內,Grok 4.3 Beta(0.5萬億參數)、Grok 4.4(1萬億參數)、Grok 4.5(1.5萬億參數)將接連登場。而真正的“怪獸”Grok 5,正在孟菲斯的Colossus 2超級計算集群上以6萬億參數的規模訓練。
當其他AI實驗室還在按季度發布更新時,馬斯克選擇了按周推進。這場豪賭的核心問題很簡單:參數規模的指數級增長,是否足以跨越AGI的門檻?
參數競賽的極限游戲:從0.5T到6T,xAI按下加速鍵
先梳理一下xAI公布的時間表。
4月17日,Grok 4.3 Beta版悄然上線。沒有發布會,沒有官方博客——這款0.5萬億參數的模型被馬斯克稱為“早期測試版”。它已經能將復雜的神經科學論文自動轉化為PPT,Office插件也在開發中。但馬斯克在第二天特意“澄清”:真正的1萬億參數完整版還在路上。
5月初,Grok 4.4將登場,參數量翻倍至1萬億。按照xAI的預期,編程能力、長上下文處理將迎來躍升。僅僅三周后,Grok 4.5帶著1.5萬億參數接踵而至。一個月之內,從0.5T到1.5T,這種參數密度的提升速度在AI發展史上尚無先例。
但這只是熱身。
正在訓練的Grok 5,參數量達到6萬億。支撐它的Colossus 2超算集群,部署了55萬塊NVIDIA GB200/GB300 GPU,總功率高達2吉瓦——足以供給一座150萬人口的城市。更值得關注的是,xAI在同一集群中同時訓練7個不同規模的模型,參數量覆蓋1T、1.5T、6T乃至10T。這意味著,Grok 5并非孤立的旗艦,而是一整套模型矩陣中的一環。
在Baron Capital投資大會上,馬斯克曾給出一個具體數字:他認為Grok 5達到AGI的概率是“10%,并且在持續上升”。如今他在X上將概率表述直接替換為肯定判斷——“Grok 5就是AGI”。
這種從概率到斷言的轉變,究竟是營銷話術,還是內部測試中看到了某種質變的跡象?xAI沒有提供更多證據。但有一點可以確定:參數規模正在以前所未有的速度膨脹,而AGI的定義本身,也在這場競賽中變得愈加模糊。
AGI的岔路口:參數堆疊不是萬能鑰匙,xAI卻有三張底牌
并不是所有人都買賬。
前特斯拉AI高級總監、OpenAI聯合創始人Andrej Karpathy近期明確表示,AGI仍然需要十年時間,遠非某些行業領袖宣稱的那樣“近在眼前”。越來越多的研究者指出,從大語言模型到通用智能,參數堆疊無法逾越的根本性鴻溝在于:理解、推理、規劃能力并不隨參數線性增長。
一個直觀的類比:給汽車裝更多輪子,不會讓它飛起來。規模擴展能提升模型的記憶容量和模式匹配能力,但真正的智能需要因果推理、常識抽象、目標導向的行為生成——這些能力是否會在某個參數量級上“涌現”,目前沒有任何理論保證。
但xAI確實手握幾張其他公司難以復制的牌。
第一張牌:X平臺的實時數據流。 每天6800萬條推文,涵蓋全球事件、輿論動態、專業知識討論。相比于經過清洗和標注的靜態數據集,X的實時信息流具有天然的多樣性、真實性和時效性。對于訓練一個需要理解人類實時語境的模型而言,這是OpenAI和Anthropic無法獲得的資源。
第二張牌:特斯拉車隊的物理世界數據。數百萬輛特斯拉汽車每天采集的真實駕駛場景——路況、天氣、行人行為、交通標志——構成了一個龐大的物理世界認知圖譜。這不僅是訓練自動駕駛的基礎,更是邁向具身智能的關鍵跳板。一個只讀過文本的模型,和另一個同時“看過”數億公里真實道路的模型,對物理規律的理解深度不可同日而語。
第三張牌:SpaceX基因的工程執行力。 122天建成一座吉瓦級超算集群——這個速度在硅谷任何其他公司都難以想象。當競爭對手還在進行跨部門協調和預算審批時,馬斯克的團隊已經在施工了。工程速度本身就是一種核心競爭力,尤其是在算力軍備競賽階段。
然而,比參數擴展更值得關注的,是xAI正在推進的多智能體架構演進。從Grok 4.20的4智能體協作,到Grok 4.20 Heavy的16智能體系統,再到Grok 5預期的動態智能體生成和跨領域專業化——這條技術路線可能比單純的參數堆疊更接近AGI的本質。一個由“程序員”智能體、“文案”智能體、“分析師”智能體組成的AI團隊,通過分工與協作完成復雜任務,這已經不再是單一模型的“規模游戲”,而是系統架構層面的進化。
AI世界大戰:四大實驗室競速,AGI門檻何時被跨過?
xAI并非這場競賽中的唯一玩家。
5月,AI行業將迎來一場密集的對決。馬斯克的Grok 4.4和4.5接連出爐;OpenAI很可能祭出GPT-5.5作為回擊;Anthropic的Opus 4.7已經在編程賽道(SWE-bench Verified)上跑出93.9%的得分——一個半年前所有人都認為不可能的數字。
開源陣營也在迎頭趕上。GLM-5.1已經在某些基準測試中超越了閉源前沿模型。如果開源模型能夠以更低的成本逼近甚至超過閉源模型,整個行業的商業邏輯將被重寫。
這場競賽的本質,早已不是簡單的參數比較。真正的衡量標準是:模型能否在未知任務上表現出人類水平的適應性和泛化能力。編程能力的突破(如Claude在SWE-bench上的表現)之所以被廣泛關注,恰恰因為它代表了一種“執行復雜、多步驟、真實世界任務”的能力,而非單純的文本生成。
馬斯克將AGI的賭注押在Grok 5上,但行業對AGI的定義本身就沒有共識。如果AGI意味著“在大多數經濟價值工作中超越人類”,那么參數擴展或許真的能在未來一兩年內接近這一目標。如果AGI意味著“具備人類水平的通用推理和自主學習能力”,那么即使6萬億參數也可能只是起點。
站在2025年4月的時間節點上,我們可以清晰地看到兩條并行的敘事線。
一條是馬斯克式的“規模信仰”:更大的模型、更多的數據、更強的算力,終將觸發智能的質變。另一條是批評者們的“結構主義”:現有架構存在天花板,參數堆疊無法帶來真正的理解與推理。
誰對誰錯,只有時間能給出答案。但有一個事實無法否認:我們正處在AI歷史上最瘋狂的實驗周期中。每一天都可能是“之前”和“之后”的分界線。
當馬斯克說“Grok 5就是AGI”時,他可能是在放煙霧彈,也可能是在陳述一個即將到來的事實。但無論結果如何,這場豪賭已經將整個行業推向了一個前所未有的加速軌道。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.