![]()
周一,黃仁勛穿著標(biāo)志性的皮衣開(kāi)啟了英偉達(dá)2026年的GTC大會(huì)。
![]()
今年的GTC,和往年有所不同。盡管全世界都在期待更快的GPU,但黃仁勛帶來(lái)的不是產(chǎn)品發(fā)布會(huì),而是一場(chǎng)關(guān)于AI時(shí)代工業(yè)革命的敘述。
英偉達(dá)全新的宏大敘事,定義了這場(chǎng)革命的生產(chǎn)資料、生產(chǎn)方式、經(jīng)濟(jì)模型,以及驅(qū)動(dòng)一切的硬件基石和操作系統(tǒng)。
短短兩個(gè)小時(shí),黃仁勛清晰地描述了英偉達(dá)的未來(lái)和整個(gè)AI行業(yè)未來(lái)的藍(lán)圖。
01
“AI工廠”的誕生和“推理拐點(diǎn)”的來(lái)臨
黃仁勛在這場(chǎng)演講中提出了兩個(gè)核心判斷,作為英偉達(dá)的戰(zhàn)略基礎(chǔ):
①推理拐點(diǎn):AI從學(xué)習(xí)走向工作。
過(guò)去的兩年中,AI的算力消耗主要集中在訓(xùn)練階段,各大AI企業(yè)都在費(fèi)盡心思研究如何設(shè)計(jì)出功能更強(qiáng)大的模型,規(guī)模化法則(Scaling Law)也正是在這個(gè)階段生效:模型越大、數(shù)據(jù)越多,性能就越好。
如今,行業(yè)已經(jīng)結(jié)束這個(gè)階段,進(jìn)入了推理階段的爆發(fā)期,OpenClaw等產(chǎn)品的爆發(fā)讓AI模型被大規(guī)模地實(shí)際應(yīng)用。
按照黃仁勛的說(shuō)法,推理所需的計(jì)算量可能達(dá)到訓(xùn)練所需的數(shù)萬(wàn)倍甚至數(shù)十萬(wàn)倍。
無(wú)論是ChatGPT、Gemini還是DeepSeek、豆包,每一次日常交流、每一次代碼生成都是一次復(fù)雜的推理。
因此,即使前沿大模型推陳出新的周期開(kāi)始放緩,GPU需求仍然在持續(xù)暴漲。
而OpenClaw作為一款有極大安全風(fēng)險(xiǎn)的開(kāi)源產(chǎn)品在全世界爆火,更是說(shuō)明我們現(xiàn)在看到的增長(zhǎng),必然只是冰山一角。
②AI工廠經(jīng)濟(jì)學(xué):定義新世界KPI
推理的拐點(diǎn)到來(lái)之際,黃仁勛也給出了數(shù)據(jù)中心的新經(jīng)濟(jì)模型:
Token將會(huì)成為新產(chǎn)品,數(shù)據(jù)中心不再是用于存儲(chǔ)數(shù)據(jù)的成本中心,而是生產(chǎn)智能的利潤(rùn)中心,也就是所謂的“AI工廠”。
算力會(huì)成為新的貨幣,與token正向關(guān)聯(lián)。
而新的KPI指標(biāo),則是每瓦特電力能夠產(chǎn)生的token數(shù)量。
在美國(guó),電力仍然是所有數(shù)據(jù)中心的最終物理瓶頸。最大化每瓦電力的token產(chǎn)出就等同于最大化收入。
通俗而準(zhǔn)確的解釋,不僅使AI行業(yè)抽象的專業(yè)詞匯更加具象化,還將從CEO到開(kāi)發(fā)者的思維都牢牢吸引到了英偉達(dá)最具優(yōu)勢(shì)的賽道上。
在這套新的經(jīng)濟(jì)范式下,英偉達(dá)的野心已經(jīng)顯露:它掌握著大量的貨幣,不愿意只給淘金的人賣鏟子,而是要打造整套“工廠藍(lán)圖”和“生產(chǎn)線”。
02
“AI工廠”的核動(dòng)力:硬件基石
英偉達(dá)最大的優(yōu)勢(shì)就是算力,除了Google靠著自研TPU硬是打出了一片天地,世界上絕大部分企業(yè)仍然受制于英偉達(dá)的GPU供給。
推理需求的爆發(fā),就意味著“AI工廠”需要消耗前所未有的能源。
值此之際,英偉達(dá)推出了宣傳已久的Vera Rubin。
![]()
相比以前GTC展示的單塊GPU,Vera Rubin是一臺(tái)機(jī)架級(jí)的超級(jí)計(jì)算機(jī)。
本質(zhì)上,它是一個(gè)極致垂直整合的產(chǎn)物,集成了新一代GPU、專為AI代理任務(wù)設(shè)計(jì)的CPU、新一代網(wǎng)絡(luò)、新一代存儲(chǔ)等七顆關(guān)鍵芯片,并結(jié)合液冷技術(shù)和精密協(xié)同設(shè)計(jì),共同封裝在一個(gè)機(jī)架之中。
自此,英偉達(dá)的交付單位,已經(jīng)從芯片躍升到即插即用的計(jì)算系統(tǒng)。
除此之外,這次GTC大會(huì)還有另一項(xiàng)技術(shù)驚喜,也就是Groq LPU技術(shù)整合。
英偉達(dá)已經(jīng)注意到現(xiàn)階段的AI計(jì)算需求開(kāi)始呈現(xiàn)極端化的趨勢(shì):
一是高吞吐量,Vera Rubin擅長(zhǎng)進(jìn)行海量并行計(jì)算,適合處理批量任務(wù);
二是超低延遲,Groq LPU有極快的單次響應(yīng)速度,這是交互式應(yīng)用的關(guān)鍵。
英偉達(dá)的解法,是在軟件層面上將所需的兩種能力“分而治之”,高強(qiáng)度的數(shù)學(xué)運(yùn)算放在Vera Rubin上,對(duì)延遲極度敏感的token生成環(huán)節(jié)則交給Groq,這一解決方案將高價(jià)值交互應(yīng)用的性能足足提升了35倍。
AI工廠的產(chǎn)出,遠(yuǎn)不止數(shù)字世界的token。
在黃仁勛看來(lái),具身智能(Embodied AI)這個(gè)更廣闊的物理世界大有可為。
但僅憑現(xiàn)實(shí)世界中的數(shù)據(jù),想訓(xùn)練機(jī)器人應(yīng)對(duì)所有突發(fā)的陌生情況,恐怕永遠(yuǎn)都不夠。
解決方案就藏在他提出的新經(jīng)濟(jì)模型中:算力就是貨幣,貨幣就能帶來(lái)數(shù)據(jù)。
通過(guò)仿真平臺(tái)生成海量高質(zhì)量的合成數(shù)據(jù),在虛擬世界中訓(xùn)練AI,再部署到現(xiàn)實(shí)世界中的機(jī)器人中。這套Sim-to-Real的路徑,或許就是解決機(jī)器人智能化的關(guān)鍵。
當(dāng)然,盲目的技術(shù)樂(lè)觀主義不可取,目前的AI模型基礎(chǔ)能力尚不足以支撐具身智能商業(yè)化落地。
不過(guò),無(wú)論是通用的機(jī)器人基礎(chǔ)模型GR00T,還是具備思考和推理能力的自動(dòng)駕駛模型Alpamayo,都證明了英偉達(dá)正在將“AI工廠”提供的生產(chǎn)力投入到了價(jià)值50萬(wàn)億美元的制造業(yè)和汽車業(yè)。
03
“AI工廠”的大腦:Dynamo 1.0
強(qiáng)大的“核反應(yīng)堆”Vera Rubin已經(jīng)誕生,接下來(lái)的問(wèn)題就是如何讓它像小龍蝦一樣7×24小時(shí)高效運(yùn)轉(zhuǎn)。
這個(gè)問(wèn)題的答案,同樣藏在軟件層面。英偉達(dá)在GTC大會(huì)同期發(fā)布的Dynamo 1.0技術(shù)博客,正式將驅(qū)動(dòng)“AI工廠”的大腦公開(kāi)于眾。
![]()
Dynamo是一個(gè)專門為大規(guī)模、多節(jié)點(diǎn)、企業(yè)級(jí)AI推理而設(shè)計(jì)的軟件框架。如果Vera Rubin是token的硬件生產(chǎn)線,那Dynamo就是生產(chǎn)線的控制器。它雖然不直接生產(chǎn)token,但卻保證了生產(chǎn)流程的效率、速度和穩(wěn)定性。
具體來(lái)說(shuō),Dynamo在以下四個(gè)方面實(shí)現(xiàn)了不同程度的技術(shù)突破:
1.在Vera Rubin平臺(tái)上,Dynamo可以通過(guò)解耦服務(wù)等技術(shù)將模型的推理請(qǐng)求處理能力提升約7倍,直接提升了核心的“KPI指標(biāo)”;
2.AI從Chatbot進(jìn)化到Agent后,智能體的工作流運(yùn)作需要經(jīng)過(guò)多輪對(duì)話、后臺(tái)思考、調(diào)用工具等復(fù)雜流程。而Dynamo具備“智能體感知”能力,能夠通過(guò)智能體提示(Agent Hints)理解任務(wù)的優(yōu)先級(jí),優(yōu)先處理關(guān)鍵任務(wù),將智能體應(yīng)用的首次響應(yīng)時(shí)間降低4倍;
3.現(xiàn)代AI應(yīng)用普遍需要頻繁啟動(dòng)新模型實(shí)例,但傳統(tǒng)方式下加載、編譯和優(yōu)化模型耗時(shí)費(fèi)力。Dynamo的ModelExpress技術(shù)通過(guò)檢查點(diǎn)恢復(fù)和模型權(quán)重流式傳輸?shù)确椒ǎ?strong>將新實(shí)例的啟動(dòng)時(shí)間加快7倍,“AI工廠”的生產(chǎn)將會(huì)更加靈活;
4.部署大模型對(duì)大部分人來(lái)說(shuō)門檻仍然太高,Dynamo的DGDR功能允許開(kāi)發(fā)者只提供模型、硬件和流量等目標(biāo),系統(tǒng)即可自動(dòng)完成性能分析、配置和部署。
Dynamo的推出,完美印證了英偉達(dá)的領(lǐng)先已經(jīng)不再局限于硬件層面,還有深不可測(cè)的軟件和系統(tǒng)工程能力。
04
英偉達(dá)的生態(tài)戰(zhàn)略
綜上所述,英偉達(dá)通過(guò)GPU構(gòu)建起來(lái)的護(hù)城河,如今已經(jīng)延伸到了生態(tài)戰(zhàn)略。
在演講中,黃仁勛將OpenClaw這個(gè)開(kāi)源智能體框架比作AI時(shí)代的Linux,并判斷它會(huì)成為下一代的操作系統(tǒng),且必將開(kāi)啟一個(gè)全新的“智能體即服務(wù)”的時(shí)代。
此前的文章中我們?cè)岬竭^(guò)一個(gè)名為NemoClaw的平臺(tái)產(chǎn)品,如今已經(jīng)正式發(fā)布。英偉達(dá)的目標(biāo)只有一個(gè):讓自己成為這場(chǎng)技術(shù)革命的標(biāo)準(zhǔn)制定者和安全守護(hù)者,讓所有企業(yè)都能放心加入這場(chǎng)養(yǎng)蝦浪潮。
同樣的策略也放在了智能體底層的基礎(chǔ)模型上。通過(guò)成立Nemotron聯(lián)盟,英偉達(dá)聯(lián)合了Mistral、Perplexity等知名AI公司,試圖共同打造下一代基礎(chǔ)模型。如此一來(lái),AI生態(tài)的軟件將與英偉達(dá)的硬件實(shí)現(xiàn)更深層的綁定。
這也正是黃仁勛的高明之處:
從芯片(Rubin)、系統(tǒng)(機(jī)架)、網(wǎng)絡(luò)(NVLink)、軟件(Dynamo)、操作系統(tǒng)(NemoClaw)到AI模型(Nemotron),英偉達(dá)在每一個(gè)環(huán)節(jié)都實(shí)現(xiàn)了深度自研和極致協(xié)同設(shè)計(jì)。
這種垂直整合的模式帶來(lái)的,是競(jìng)爭(zhēng)對(duì)手難以比擬的性能和效率。
與此同時(shí),英偉達(dá)也并未試圖獨(dú)吞市場(chǎng)。
與各大云廠商和AI初創(chuàng)公司合作,表面上是“賦能所有人”,“給云廠商帶來(lái)客戶”,實(shí)則是將自己的技術(shù)棧嵌入全球的計(jì)算平臺(tái),使整個(gè)生態(tài)系統(tǒng)都建立在英偉達(dá)的底層技術(shù)之上。
未來(lái)如果回顧2026年的GTC,或許它就是一個(gè)時(shí)代的轉(zhuǎn)折點(diǎn)。
英偉達(dá)構(gòu)建了一個(gè)以token為商品、以算力為貨幣、以“AI工廠”為核心生產(chǎn)單位的全新經(jīng)濟(jì)循環(huán)。
在這個(gè)循環(huán)中,英偉達(dá)有最高效的生產(chǎn)工具、最智能的生產(chǎn)管理系統(tǒng),甚至定義了生產(chǎn)標(biāo)準(zhǔn)。
它不再是一家GPU供應(yīng)商,而是AI基礎(chǔ)設(shè)施與經(jīng)濟(jì)體構(gòu)建者。
未來(lái)的“卡脖子”,只會(huì)更緊。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.