網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

黃仁勛“述職報(bào)告”2026

2026-03-18 07:34:14　來(lái)源: 硅基星芒AI

北京舉報(bào)

分享至

周一，黃仁勛穿著標(biāo)志性的皮衣開(kāi)啟了英偉達(dá)2026年的GTC大會(huì)。

今年的GTC，和往年有所不同。盡管全世界都在期待更快的GPU，但黃仁勛帶來(lái)的不是產(chǎn)品發(fā)布會(huì)，而是一場(chǎng)關(guān)于AI時(shí)代工業(yè)革命的敘述。

英偉達(dá)全新的宏大敘事，定義了這場(chǎng)革命的生產(chǎn)資料、生產(chǎn)方式、經(jīng)濟(jì)模型，以及驅(qū)動(dòng)一切的硬件基石和操作系統(tǒng)。

短短兩個(gè)小時(shí)，黃仁勛清晰地描述了英偉達(dá)的未來(lái)和整個(gè)AI行業(yè)未來(lái)的藍(lán)圖。

“AI工廠”的誕生和“推理拐點(diǎn)”的來(lái)臨

黃仁勛在這場(chǎng)演講中提出了兩個(gè)核心判斷，作為英偉達(dá)的戰(zhàn)略基礎(chǔ)：

①推理拐點(diǎn)：AI從學(xué)習(xí)走向工作。

過(guò)去的兩年中，AI的算力消耗主要集中在訓(xùn)練階段，各大AI企業(yè)都在費(fèi)盡心思研究如何設(shè)計(jì)出功能更強(qiáng)大的模型，規(guī)模化法則（Scaling Law）也正是在這個(gè)階段生效：模型越大、數(shù)據(jù)越多，性能就越好。

如今，行業(yè)已經(jīng)結(jié)束這個(gè)階段，進(jìn)入了推理階段的爆發(fā)期，OpenClaw等產(chǎn)品的爆發(fā)讓AI模型被大規(guī)模地實(shí)際應(yīng)用。

按照黃仁勛的說(shuō)法，推理所需的計(jì)算量可能達(dá)到訓(xùn)練所需的數(shù)萬(wàn)倍甚至數(shù)十萬(wàn)倍。

無(wú)論是ChatGPT、Gemini還是DeepSeek、豆包，每一次日常交流、每一次代碼生成都是一次復(fù)雜的推理。

因此，即使前沿大模型推陳出新的周期開(kāi)始放緩，GPU需求仍然在持續(xù)暴漲。

而OpenClaw作為一款有極大安全風(fēng)險(xiǎn)的開(kāi)源產(chǎn)品在全世界爆火，更是說(shuō)明我們現(xiàn)在看到的增長(zhǎng)，必然只是冰山一角。

②AI工廠經(jīng)濟(jì)學(xué)：定義新世界KPI

推理的拐點(diǎn)到來(lái)之際，黃仁勛也給出了數(shù)據(jù)中心的新經(jīng)濟(jì)模型：

Token將會(huì)成為新產(chǎn)品，數(shù)據(jù)中心不再是用于存儲(chǔ)數(shù)據(jù)的成本中心，而是生產(chǎn)智能的利潤(rùn)中心，也就是所謂的“AI工廠”。

算力會(huì)成為新的貨幣，與token正向關(guān)聯(lián)。

而新的KPI指標(biāo)，則是每瓦特電力能夠產(chǎn)生的token數(shù)量。

在美國(guó)，電力仍然是所有數(shù)據(jù)中心的最終物理瓶頸。最大化每瓦電力的token產(chǎn)出就等同于最大化收入。

通俗而準(zhǔn)確的解釋，不僅使AI行業(yè)抽象的專業(yè)詞匯更加具象化，還將從CEO到開(kāi)發(fā)者的思維都牢牢吸引到了英偉達(dá)最具優(yōu)勢(shì)的賽道上。

在這套新的經(jīng)濟(jì)范式下，英偉達(dá)的野心已經(jīng)顯露：它掌握著大量的貨幣，不愿意只給淘金的人賣鏟子，而是要打造整套“工廠藍(lán)圖”和“生產(chǎn)線”。

“AI工廠”的核動(dòng)力：硬件基石

英偉達(dá)最大的優(yōu)勢(shì)就是算力，除了Google靠著自研TPU硬是打出了一片天地，世界上絕大部分企業(yè)仍然受制于英偉達(dá)的GPU供給。

推理需求的爆發(fā)，就意味著“AI工廠”需要消耗前所未有的能源。

值此之際，英偉達(dá)推出了宣傳已久的Vera Rubin。

相比以前GTC展示的單塊GPU，Vera Rubin是一臺(tái)機(jī)架級(jí)的超級(jí)計(jì)算機(jī)。

本質(zhì)上，它是一個(gè)極致垂直整合的產(chǎn)物，集成了新一代GPU、專為AI代理任務(wù)設(shè)計(jì)的CPU、新一代網(wǎng)絡(luò)、新一代存儲(chǔ)等七顆關(guān)鍵芯片，并結(jié)合液冷技術(shù)和精密協(xié)同設(shè)計(jì)，共同封裝在一個(gè)機(jī)架之中。

自此，英偉達(dá)的交付單位，已經(jīng)從芯片躍升到即插即用的計(jì)算系統(tǒng)。

除此之外，這次GTC大會(huì)還有另一項(xiàng)技術(shù)驚喜，也就是Groq LPU技術(shù)整合。

英偉達(dá)已經(jīng)注意到現(xiàn)階段的AI計(jì)算需求開(kāi)始呈現(xiàn)極端化的趨勢(shì)：

一是高吞吐量，Vera Rubin擅長(zhǎng)進(jìn)行海量并行計(jì)算，適合處理批量任務(wù)；

二是超低延遲，Groq LPU有極快的單次響應(yīng)速度，這是交互式應(yīng)用的關(guān)鍵。

英偉達(dá)的解法，是在軟件層面上將所需的兩種能力“分而治之”，高強(qiáng)度的數(shù)學(xué)運(yùn)算放在Vera Rubin上，對(duì)延遲極度敏感的token生成環(huán)節(jié)則交給Groq，這一解決方案將高價(jià)值交互應(yīng)用的性能足足提升了35倍。

AI工廠的產(chǎn)出，遠(yuǎn)不止數(shù)字世界的token。

在黃仁勛看來(lái)，具身智能（Embodied AI）這個(gè)更廣闊的物理世界大有可為。

但僅憑現(xiàn)實(shí)世界中的數(shù)據(jù)，想訓(xùn)練機(jī)器人應(yīng)對(duì)所有突發(fā)的陌生情況，恐怕永遠(yuǎn)都不夠。

解決方案就藏在他提出的新經(jīng)濟(jì)模型中：算力就是貨幣，貨幣就能帶來(lái)數(shù)據(jù)。

通過(guò)仿真平臺(tái)生成海量高質(zhì)量的合成數(shù)據(jù)，在虛擬世界中訓(xùn)練AI，再部署到現(xiàn)實(shí)世界中的機(jī)器人中。這套Sim-to-Real的路徑，或許就是解決機(jī)器人智能化的關(guān)鍵。

當(dāng)然，盲目的技術(shù)樂(lè)觀主義不可取，目前的AI模型基礎(chǔ)能力尚不足以支撐具身智能商業(yè)化落地。

不過(guò)，無(wú)論是通用的機(jī)器人基礎(chǔ)模型GR00T，還是具備思考和推理能力的自動(dòng)駕駛模型Alpamayo，都證明了英偉達(dá)正在將“AI工廠”提供的生產(chǎn)力投入到了價(jià)值50萬(wàn)億美元的制造業(yè)和汽車業(yè)。

“AI工廠”的大腦：Dynamo 1.0

強(qiáng)大的“核反應(yīng)堆”Vera Rubin已經(jīng)誕生，接下來(lái)的問(wèn)題就是如何讓它像小龍蝦一樣7×24小時(shí)高效運(yùn)轉(zhuǎn)。

這個(gè)問(wèn)題的答案，同樣藏在軟件層面。英偉達(dá)在GTC大會(huì)同期發(fā)布的Dynamo 1.0技術(shù)博客，正式將驅(qū)動(dòng)“AI工廠”的大腦公開(kāi)于眾。

Dynamo是一個(gè)專門為大規(guī)模、多節(jié)點(diǎn)、企業(yè)級(jí)AI推理而設(shè)計(jì)的軟件框架。如果Vera Rubin是token的硬件生產(chǎn)線，那Dynamo就是生產(chǎn)線的控制器。它雖然不直接生產(chǎn)token，但卻保證了生產(chǎn)流程的效率、速度和穩(wěn)定性。

具體來(lái)說(shuō)，Dynamo在以下四個(gè)方面實(shí)現(xiàn)了不同程度的技術(shù)突破：

1.在Vera Rubin平臺(tái)上，Dynamo可以通過(guò)解耦服務(wù)等技術(shù)將模型的推理請(qǐng)求處理能力提升約7倍，直接提升了核心的“KPI指標(biāo)”；

2.AI從Chatbot進(jìn)化到Agent后，智能體的工作流運(yùn)作需要經(jīng)過(guò)多輪對(duì)話、后臺(tái)思考、調(diào)用工具等復(fù)雜流程。而Dynamo具備“智能體感知”能力，能夠通過(guò)智能體提示（Agent Hints）理解任務(wù)的優(yōu)先級(jí)，優(yōu)先處理關(guān)鍵任務(wù)，將智能體應(yīng)用的首次響應(yīng)時(shí)間降低4倍；

3.現(xiàn)代AI應(yīng)用普遍需要頻繁啟動(dòng)新模型實(shí)例，但傳統(tǒng)方式下加載、編譯和優(yōu)化模型耗時(shí)費(fèi)力。Dynamo的ModelExpress技術(shù)通過(guò)檢查點(diǎn)恢復(fù)和模型權(quán)重流式傳輸?shù)确椒ǎ?strong>將新實(shí)例的啟動(dòng)時(shí)間加快7倍，“AI工廠”的生產(chǎn)將會(huì)更加靈活；

4.部署大模型對(duì)大部分人來(lái)說(shuō)門檻仍然太高，Dynamo的DGDR功能允許開(kāi)發(fā)者只提供模型、硬件和流量等目標(biāo)，系統(tǒng)即可自動(dòng)完成性能分析、配置和部署。

Dynamo的推出，完美印證了英偉達(dá)的領(lǐng)先已經(jīng)不再局限于硬件層面，還有深不可測(cè)的軟件和系統(tǒng)工程能力。

英偉達(dá)的生態(tài)戰(zhàn)略

綜上所述，英偉達(dá)通過(guò)GPU構(gòu)建起來(lái)的護(hù)城河，如今已經(jīng)延伸到了生態(tài)戰(zhàn)略。

在演講中，黃仁勛將OpenClaw這個(gè)開(kāi)源智能體框架比作AI時(shí)代的Linux，并判斷它會(huì)成為下一代的操作系統(tǒng)，且必將開(kāi)啟一個(gè)全新的“智能體即服務(wù)”的時(shí)代。

此前的文章中我們?cè)岬竭^(guò)一個(gè)名為NemoClaw的平臺(tái)產(chǎn)品，如今已經(jīng)正式發(fā)布。英偉達(dá)的目標(biāo)只有一個(gè)：讓自己成為這場(chǎng)技術(shù)革命的標(biāo)準(zhǔn)制定者和安全守護(hù)者，讓所有企業(yè)都能放心加入這場(chǎng)養(yǎng)蝦浪潮。

同樣的策略也放在了智能體底層的基礎(chǔ)模型上。通過(guò)成立Nemotron聯(lián)盟，英偉達(dá)聯(lián)合了Mistral、Perplexity等知名AI公司，試圖共同打造下一代基礎(chǔ)模型。如此一來(lái)，AI生態(tài)的軟件將與英偉達(dá)的硬件實(shí)現(xiàn)更深層的綁定。

這也正是黃仁勛的高明之處：

從芯片（Rubin）、系統(tǒng)（機(jī)架）、網(wǎng)絡(luò)（NVLink）、軟件（Dynamo）、操作系統(tǒng)（NemoClaw）到AI模型（Nemotron），英偉達(dá)在每一個(gè)環(huán)節(jié)都實(shí)現(xiàn)了深度自研和極致協(xié)同設(shè)計(jì)。

這種垂直整合的模式帶來(lái)的，是競(jìng)爭(zhēng)對(duì)手難以比擬的性能和效率。

與此同時(shí)，英偉達(dá)也并未試圖獨(dú)吞市場(chǎng)。

與各大云廠商和AI初創(chuàng)公司合作，表面上是“賦能所有人”，“給云廠商帶來(lái)客戶”，實(shí)則是將自己的技術(shù)棧嵌入全球的計(jì)算平臺(tái)，使整個(gè)生態(tài)系統(tǒng)都建立在英偉達(dá)的底層技術(shù)之上。

未來(lái)如果回顧2026年的GTC，或許它就是一個(gè)時(shí)代的轉(zhuǎn)折點(diǎn)。

英偉達(dá)構(gòu)建了一個(gè)以token為商品、以算力為貨幣、以“AI工廠”為核心生產(chǎn)單位的全新經(jīng)濟(jì)循環(huán)。

在這個(gè)循環(huán)中，英偉達(dá)有最高效的生產(chǎn)工具、最智能的生產(chǎn)管理系統(tǒng)，甚至定義了生產(chǎn)標(biāo)準(zhǔn)。

它不再是一家GPU供應(yīng)商，而是AI基礎(chǔ)設(shè)施與經(jīng)濟(jì)體構(gòu)建者。

未來(lái)的“卡脖子”，只會(huì)更緊。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.