黃仁勛CES2026最新演講：三個關(guān)鍵話題，一臺“芯片怪獸” |【經(jīng)緯低調(diào)分享】

2026-01-06 12:21:59　來源: 經(jīng)緯創(chuàng)投

北京舉報

分享至

今日凌晨，英偉達CEO黃仁勛身著標(biāo)志性皮衣亮相CES2026主舞臺，帶來一場聚焦AI推理時代的重磅演講。

黃仁勛的演講不是一次單純的技術(shù)發(fā)布。演講中貫穿的 “AI 工業(yè)化” 主線、物理 AI 的場景落地路徑，以及全棧生態(tài)的構(gòu)建邏輯，清晰揭示了行業(yè)從 “實驗室技術(shù)比拼” 向 “規(guī)模化商業(yè)變現(xiàn)” 的關(guān)鍵跨越 —— 當(dāng)算力成本通過 Rubin 架構(gòu)實現(xiàn) 10 倍下降，當(dāng)自動駕駛、人形機器人明確 2026 年量產(chǎn)節(jié)點，當(dāng)開源生態(tài)打破巨頭壟斷，AI 產(chǎn)業(yè)的投資邏輯已從 “賭技術(shù)突破” 轉(zhuǎn)向 “抓落地確定性”。

那么，開源生態(tài)將打破 “巨頭壟斷”后，是否會催生大量垂直領(lǐng)域初創(chuàng)公司？“物理世界的 AI 改造”，能否定義下一個十年的 AI 產(chǎn)業(yè)格局？這篇文章，整理了演講中的干貨。以下，Enjoy：

本文經(jīng)授權(quán)轉(zhuǎn)自騰訊科技(ID: qqtech)

文丨李海倫蘇揚

編輯丨徐青陽

北京時間1月6日，英偉達CEO黃仁勛身著標(biāo)志性皮衣再次站在CES2026的主舞臺上。

2025年CES，英偉達展示了量產(chǎn)的Blackwell芯片和完整的物理AI技術(shù)棧。在會上，黃仁勛強調(diào)，一個“物理AI時代”正在開啟。他描繪了一個充滿想象力的未來：自動駕駛汽車具備推理能力，機器人能夠理解并思考，AI Agent（智能體）可以處理百萬級 token 的長上下文任務(wù)。

轉(zhuǎn)眼一年過去，AI行業(yè)經(jīng)歷了巨大的變革演進。黃仁勛在發(fā)布會上回顧這一年的變化時，重點提到了開源模型。

他說，像DeepSeek R1這樣的開源推理模型，讓整個行業(yè)意識到：當(dāng)開放、全球協(xié)作真正啟動后，AI的擴散速度會極快。盡管開源模型在整體能力上仍比最前沿模型慢大約半年，但每隔六個月就會追近一次，而且下載量和使用量已經(jīng)呈爆發(fā)式增長。

相比2025年更多展示愿景與可能性，這一次英偉達開始系統(tǒng)性地希望解決“如何實現(xiàn)”的問題：圍繞推理型AI，補齊長期運行所需的算力、網(wǎng)絡(luò)與存儲基礎(chǔ)設(shè)施，顯著壓低推理成本，并將這些能力直接嵌入自動駕駛和機器人等真實場景。

在本次黃仁勛在CES上的演講，圍繞三條主線展開：

● 在系統(tǒng)與基礎(chǔ)設(shè)施層面，英偉達圍繞長期推理需求重構(gòu)了算力、網(wǎng)絡(luò)與存儲架構(gòu)。以Rubin平臺、NVLink 6、Spectrum-X以太網(wǎng)和推理上下文內(nèi)存存儲平臺為核心，這些更新直指推理成本高、上下文難以持續(xù)和規(guī)模化受限等瓶頸，解決AI多想一會、算得起、跑得久的問題。

● 在模型層面，英偉達將推理型 AI（Reasoning / Agentic AI）置于核心位置。通過Alpamayo、Nemotron、Cosmos Reason 等模型與工具，推動 AI 從“生成內(nèi)容”邁向能夠持續(xù)思考、從“一次性響應(yīng)的模型”轉(zhuǎn)向“可以長期工作的智能體”。

● 在應(yīng)用與落地層面，這些能力被直接引入自動駕駛和機器人等物理AI場景。無論是 Alpamayo 驅(qū)動的自動駕駛體系，還是GR00T 與 Jetson的機器人生態(tài)，都在通過云廠商和企業(yè)級平臺合作，推動規(guī)模化部署。

01

從路線圖到量產(chǎn)：Rubin首次完整披露性能數(shù)據(jù)

在本次CES上，英偉達首次完整披露了Rubin架構(gòu)的技術(shù)細節(jié)。

演講中，黃仁勛從Test-time Scaling（推理時擴展）開始鋪墊，這個概念可以理解為，想要AI變聰明，不再只是讓它“多努力讀書”，而是靠“遇到問題時多想一會兒”。

過去，AI 能力的提升主要靠訓(xùn)練階段砸更多算力，把模型越做越大；而現(xiàn)在，新的變化是哪怕模型不再繼續(xù)變大，只要在每次使用時給它多一點時間和算力去思考，結(jié)果也能明顯變好。

如何讓“AI多思考一會兒”變得經(jīng)濟可行？Rubin架構(gòu)的新一代AI計算平臺就是來解決這個問題。

黃仁勛介紹，這是一套完整的下一代AI計算系統(tǒng)，通過Vera CPU、Rubin GPU、NVLink 6、ConnectX-9、BlueField-4、Spectrum-6的協(xié)同設(shè)計，以此實現(xiàn)推理成本的革命性下降。

英偉達Rubin GPU 是Rubin 架構(gòu)中負責(zé) AI 計算的核心芯片，目標(biāo)是顯著降低推理與訓(xùn)練的單位成本。

說白了，Rubin GPU 核心任務(wù)是“讓 AI 用起來更省、更聰明”。

Rubin GPU 的核心能力在于：同一塊 GPU 能干更多活。它一次能處理更多推理任務(wù)、記住更長的上下文，和其他 GPU 之間的溝通也更快，這意味著很多原本要靠“多卡硬堆”的場景，現(xiàn)在可以用更少的 GPU 完成。

結(jié)果就是，推理不但更快了，而且明顯更便宜。

黃仁勛現(xiàn)場給大家復(fù)習(xí)了Rubin架構(gòu)的NVL72硬件參數(shù)：包含220萬億晶體管，帶寬260 TB/秒，是業(yè)界首個支持機架規(guī)模機密計算的平臺。

整體來看，相比Blackwell，Rubin GPU在關(guān)鍵指標(biāo)上實現(xiàn)跨代躍升：NVFP4 推理性能提升至 50 PFLOPS（5 倍）、訓(xùn)練性能提升至 35 PFLOPS（3.5 倍），HBM4 內(nèi)存帶寬提升至 22 TB/s（2.8 倍），單 GPU 的 NVLink 互連帶寬翻倍至 3.6 TB/s。

這些提升共同作用，使單個 GPU 能處理更多推理任務(wù)與更長上下文，從根本上減少對 GPU 數(shù)量的依賴。

Vera CPU是專為數(shù)據(jù)移動和Agentic處理設(shè)計的核心組件，采用88個英偉達自研Olympus核心，配備1.5 TB系統(tǒng)內(nèi)存（是上代Grace CPU的3倍），通過1.8 TB/s的NVLink-C2C技術(shù)實現(xiàn)CPU與GPU之間的一致性內(nèi)存訪問。

與傳統(tǒng)通用CPU不同，Vera專注于AI推理場景中的數(shù)據(jù)調(diào)度和多步驟推理邏輯處理，本質(zhì)上是讓“AI多想一會兒”得以高效運行的系統(tǒng)協(xié)調(diào)者。

NVLink 6通過3.6 TB/s的帶寬和網(wǎng)絡(luò)內(nèi)計算能力，讓Rubin架構(gòu)中的72個GPU能像一個超級GPU一樣協(xié)同工作，這是實現(xiàn)“推理成本降至1/7”的關(guān)鍵基礎(chǔ)設(shè)施。

這樣一來，AI 在推理時需要的數(shù)據(jù)和中間結(jié)果可以迅速在 GPU 之間流轉(zhuǎn)，不用反復(fù)等待、拷貝或重算。

在Rubin架構(gòu)中，NVLink-6負責(zé)GPU內(nèi)部協(xié)同計算，BlueField-4負責(zé)上下文與數(shù)據(jù)調(diào)度，而ConnectX-9則承擔(dān)系統(tǒng)對外的高速網(wǎng)絡(luò)連接。它確保Rubin系統(tǒng)能夠與其他機架、數(shù)據(jù)中心和云平臺高效通信，是大規(guī)模訓(xùn)練和推理任務(wù)順利運行的前提條件。

相比上一代架構(gòu)，英偉達也給出具體直觀的數(shù)據(jù)：相比 NVIDIA Blackwell 平臺，可將推理階段的 token 成本最高降低10倍，并將訓(xùn)練混合專家模型（MoE）所需的 GPU 數(shù)量減少至原來的1/4。

英偉達官方表示，目前微軟已承諾在下一代Fairwater AI超級工廠中部署數(shù)十萬Vera Rubin芯片，CoreWeave等云服務(wù)商將在2026年下半年提供Rubin實例，這套“讓AI多想一會兒”的基礎(chǔ)設(shè)施正在從技術(shù)演示走向規(guī)模化商用。

02

存儲瓶頸如何解決

讓AI“多想一會兒”還面臨一個關(guān)鍵技術(shù)挑戰(zhàn)：上下文數(shù)據(jù)該放在哪里？

當(dāng)AI處理需要多輪對話、多步推理的復(fù)雜任務(wù)時，會產(chǎn)生大量上下文數(shù)據(jù)（KV Cache）。傳統(tǒng)架構(gòu)要么把它們?nèi)M昂貴且容量有限的GPU內(nèi)存，要么放到普通存儲里（訪問太慢）。這個“存儲瓶頸”如果不解決，再強的GPU也會被拖累。

針對這個問題，英偉達在本次CES上首次完整披露了由BlueField-4驅(qū)動的推理上下文內(nèi)存存儲平臺（Inference Context Memory Storage Platform），核心目標(biāo)是在GPU內(nèi)存和傳統(tǒng)存儲之間創(chuàng)建一個“第三層”。既足夠快，又有充足容量，還能支撐AI長期運行。

從技術(shù)實現(xiàn)上看，這個平臺并不是單一組件在發(fā)揮作用，而是一套協(xié)同設(shè)計的結(jié)果：

BlueField-4 負責(zé)在硬件層面加速上下文數(shù)據(jù)的管理與訪問，減少數(shù)據(jù)搬移和系統(tǒng)開銷；
Spectrum-X 以太網(wǎng)提供高性能網(wǎng)絡(luò)，支持基于 RDMA 的高速數(shù)據(jù)共享；
DOCA、NIXL和Dynamo等軟件組件，則負責(zé)在系統(tǒng)層面優(yōu)化調(diào)度、降低延遲、提升整體吞吐。

我們可以理解為，這套平臺的做法是，將原本只能放在GPU內(nèi)存里的上下文數(shù)據(jù)，擴展到一個獨立、高速、可共享的“記憶層”中。一方面釋放 GPU 的壓力，另一方面又能在多個節(jié)點、多個 AI 智能體之間快速共享這些上下文信息。

在實際效果方面，英偉達官方給出的數(shù)據(jù)是：在特定場景下，這種方式可以讓每秒處理的 token數(shù)提升最高達5倍，并實現(xiàn)同等水平的能效優(yōu)化。

黃仁勛在發(fā)布中多次強調(diào)，AI正在從“一次性對話的聊天機器人”，演進為真正的智能協(xié)作體：它們需要理解現(xiàn)實世界、持續(xù)推理、調(diào)用工具完成任務(wù)，并同時保留短期與長期記憶。這正是 Agentic AI 的核心特征。推理上下文內(nèi)存存儲平臺，正是為這種長期運行、反復(fù)思考的 AI 形態(tài)而設(shè)計，通過擴大上下文容量、加快跨節(jié)點共享，讓多輪對話和多智能體協(xié)作更加穩(wěn)定，不再“越跑越慢”。

03

新一代DGX SuperPOD ：讓576個GPU協(xié)同工作

英偉達在本次CES上宣布推出基于Rubin架構(gòu)的新一代DGX SuperPOD（超節(jié)點），將Rubin從單機架擴展到整個數(shù)據(jù)中心的完整方案。

什么是DGX SuperPOD？

如果說Rubin NVL72是一個裝有72個GPU的“超級機架”，那么DGX SuperPOD就是把多個這樣的機架連接起來，形成一個更大規(guī)模的AI計算集群。這次發(fā)布的版本由8個Vera Rubin NVL72機架組成，相當(dāng)于576個GPU協(xié)同工作。

當(dāng)AI任務(wù)規(guī)模繼續(xù)擴大時，單個機架的576個GPU可能還不夠。比如訓(xùn)練超大規(guī)模模型、同時服務(wù)數(shù)千個Agentic AI智能體、或者處理需要數(shù)百萬token上下文的復(fù)雜任務(wù)。這時就需要多個機架協(xié)同工作，而DGX SuperPOD就是為這種場景設(shè)計的標(biāo)準(zhǔn)化方案。

對于企業(yè)和云服務(wù)商來說，DGX SuperPOD提供的是一個“開箱即用”的大規(guī)模AI基礎(chǔ)設(shè)施方案。不需要自己研究如何把數(shù)百個GPU連接起來、如何配置網(wǎng)絡(luò)、如何管理存儲等問題。

新一代DGX SuperPOD五大核心組件：

○ 8個Vera Rubin NVL72機架 - 提供計算能力的核心，每個機架72個GPU，總共576個GPU；

○ NVLink 6擴展網(wǎng)絡(luò) - 讓這8個機架內(nèi)的576個GPU能像一個超大GPU一樣協(xié)同工作；

○ Spectrum-X以太網(wǎng)擴展網(wǎng)絡(luò) - 連接不同的SuperPOD，以及連接到存儲和外部網(wǎng)絡(luò)；

○ 推理上下文內(nèi)存存儲平臺 - 為長時間推理任務(wù)提供共享的上下文數(shù)據(jù)存儲；

○ 英偉達Mission Control軟件 - 管理整個系統(tǒng)的調(diào)度、監(jiān)控和優(yōu)化。

這一次的升級，SuperPOD的基礎(chǔ)以DGX Vera Rubin NVL72機架級系統(tǒng)為核心。每一臺 NVL72本身就是一臺完整的AI超級計算機，內(nèi)部通過NVLink 6 將72塊Rubin GPU 連接在一起，能夠在一個機架內(nèi)完成大規(guī)模推理和訓(xùn)練任務(wù)。新的DGX SuperPOD，則由多臺NVL72 組成，形成一個可以長期運行的系統(tǒng)級集群。

當(dāng)計算規(guī)模從“單機架”擴展到“多機架”后，新的瓶頸隨之出現(xiàn)：如何在機架之間穩(wěn)定、高效地傳輸海量數(shù)據(jù)。圍繞這一問題，英偉達在本次 CES 上同步發(fā)布了基于 Spectrum-6 芯片的新一代以太網(wǎng)交換機，并首次引入“共封裝光學(xué)”（CPO）技術(shù)。

簡單來看，就是將原本可插拔的光模塊直接封裝在交換芯片旁邊，把信號傳輸距離從幾米縮短到幾毫米，從而顯著降低功耗和延遲，也提升了系統(tǒng)整體的穩(wěn)定性。

04

英偉達開源AI全家桶：從數(shù)據(jù)到代碼一應(yīng)俱全

本次CES上，黃仁勛宣布擴展其開源模型生態(tài)（Open Model Universe），新增和更新了一系列模型、數(shù)據(jù)集、代碼庫和工具。這個生態(tài)覆蓋六大領(lǐng)域：生物醫(yī)學(xué)AI（Clara）、AI物理模擬（Earth-2）、Agentic AI（Nemotron）、物理AI（Cosmos）、機器人（GR00T）和自動駕駛（Alpamayo）。

訓(xùn)練一個AI模型需要的不只是算力，還需要高質(zhì)量數(shù)據(jù)集、預(yù)訓(xùn)練模型、訓(xùn)練代碼、評估工具等一整套基礎(chǔ)設(shè)施。對大多數(shù)企業(yè)和研究機構(gòu)來說，從零開始搭建這些太耗時間。

具體來說，英偉達開源了六個層次的內(nèi)容：算力平臺（DGX、HGX等）、各領(lǐng)域的訓(xùn)練數(shù)據(jù)集、預(yù)訓(xùn)練的基礎(chǔ)模型、推理和訓(xùn)練代碼庫、完整的訓(xùn)練流程腳本，以及端到端的解決方案模板。

Nemotron系列是此次更新的重點，覆蓋了四個應(yīng)用方向。

在推理方向，包括Nemotron 3 Nano、Nemotron 2 Nano VL等小型化推理模型，以及NeMo RL、NeMo Gym等強化學(xué)習(xí)訓(xùn)練工具。在RAG（檢索增強生成）方向，提供了Nemotron Embed VL（向量嵌入模型）、Nemotron Rerank VL（重排序模型）、相關(guān)數(shù)據(jù)集和NeMo Retriever Library（檢索庫）。在安全方向，有Nemotron Content Safety內(nèi)容安全模型及配套數(shù)據(jù)集、NeMo Guardrails護欄庫。

在語音方向，則包含Nemotron ASR自動語音識別、Granary Dataset語音數(shù)據(jù)集和NeMo Library語音處理庫。這意味著企業(yè)想做一個帶RAG的AI客服系統(tǒng)，不需要自己訓(xùn)練嵌入模型和重排序模型，可以直接使用英偉達已經(jīng)訓(xùn)練好并開源的代碼。

05

物理AI領(lǐng)域走向商業(yè)化落地

物理AI領(lǐng)域同樣有模型更新——用于理解和生成物理世界視頻的Cosmos，機器人通用基礎(chǔ)模型Isaac GR00T、自動駕駛視覺-語言-行動模型Alpamayo。

黃仁勛在CES上聲稱，物理AI的“ChatGPT時刻”快要來了，但面對挑戰(zhàn)也很多：物理世界太復(fù)雜多變，采集真實數(shù)據(jù)又慢又貴，永遠不夠用。

怎么辦呢？合成數(shù)據(jù)是條路。于是英偉達推出了Cosmos。

這是一個開源的物理AI世界基礎(chǔ)模型，目前已經(jīng)用海量視頻、真實駕駛與機器人數(shù)據(jù)，以及3D模擬做過預(yù)訓(xùn)練。它能理解世界是怎么運行的，可以把語言、圖像、3D和動作聯(lián)系起來。

黃仁勛表示，Cosmos能實現(xiàn)不少物理AI技能，比如生成內(nèi)容、做推理、預(yù)測軌跡（哪怕只給它一張圖）。它可以依據(jù)3D場景生成逼真的視頻，根據(jù)駕駛數(shù)據(jù)生成符合物理規(guī)律的運動，還能從模擬器、多攝像頭畫面或文字描述生成全景視頻。就連罕見場景，也能還原出來。

黃仁勛還正式發(fā)布了Alpamayo。Alpamayo是一個面向自動駕駛領(lǐng)域的開源工具鏈，也是首個開源的視覺-語言-行動（VLA）推理模型。與之前僅開源代碼不同，英偉達這次開源了從數(shù)據(jù)到部署的完整開發(fā)資源。

Alpamayo最大的突破在于它是“推理型”自動駕駛模型。傳統(tǒng)自動駕駛系統(tǒng)是“感知-規(guī)劃-控制”的流水線架構(gòu)，看到紅燈就剎車，看到行人就減速，遵循預(yù)設(shè)規(guī)則。而Alpamayo引入了“推理”能力，理解復(fù)雜場景中的因果關(guān)系，預(yù)測其他車輛和行人的意圖，甚至能處理需要多步思考的決策。

比如在十字路口，它不只是識別出“前方有車”，而是能推理”那輛車可能要左轉(zhuǎn)，所以我應(yīng)該等它先過”。這種能力讓自動駕駛從“按規(guī)則行駛”升級到“像人一樣思考”。

黃仁勛宣布英偉達DRIVE系統(tǒng)正式進入量產(chǎn)階段，首個應(yīng)用是全新的梅賽德斯-奔馳CLA，計劃2026年在美國上路。這款車將搭載L2++級自動駕駛系統(tǒng)，采用“端到端AI模型+傳統(tǒng)流水線”的混合架構(gòu)。

機器人領(lǐng)域同樣有實質(zhì)性進展。

黃仁勛表示包括Boston Dynamics、Franka Robotics、LEM Surgical、LG Electronics、Neura Robotics和XRlabs在內(nèi)的全球機器人領(lǐng)軍企業(yè)，正在基于英偉達Isaac平臺和GR00T基礎(chǔ)模型開發(fā)產(chǎn)品，覆蓋了從工業(yè)機器人、手術(shù)機器人到人形機器人、消費級機器人的多個領(lǐng)域。

在發(fā)布會現(xiàn)場，黃仁勛背后站滿了不同形態(tài)、不同用途的機器人，它們被集中展示在分層舞臺上：從人形機器人、雙足與輪式服務(wù)機器人，到工業(yè)機械臂、工程機械、無人機與手術(shù)輔助設(shè)備，展現(xiàn)出一版“機器人生態(tài)圖景”。

從物理AI應(yīng)用到RubinAI計算平臺,再到推理上下文內(nèi)存存儲平臺和開源AI“全家桶”。

英偉達在CES上展示的這些動作，構(gòu)成了英偉達對于推理時代AI基礎(chǔ)設(shè)施的敘事。正如黃仁勛反復(fù)強調(diào)的那樣，當(dāng)物理 AI 需要持續(xù)思考、長期運行，并真正進入現(xiàn)實世界，問題已經(jīng)不再只是算力夠不夠，而是誰能把整套系統(tǒng)真正搭起來。

CES 2026 上，英偉達已經(jīng)給出了一份答卷。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.