![]()
智東西
作者 ZeR0
編輯 漠影
英偉達(dá)憋了許久的芯片大招,終于來了。
智東西6月1日報道,今日,在GTC臺北大會上,英偉達(dá)創(chuàng)始人兼CEO黃仁勛穿著閃亮的黑色皮衣發(fā)表主題演講,發(fā)布2款芯片、1款桌面級AI超算、多款開源AI模型、框架、函數(shù)庫,還與宇樹科技聯(lián)合發(fā)布了基于宇樹H2 Plus機(jī)器人的全新人形機(jī)器人參考設(shè)計。
![]()
傳聞已久的英偉達(dá)首款A(yù)rm架構(gòu)PC芯片終于亮相,名為RTX Spark超級芯片。黃仁勛宣布與微軟推出全新PC產(chǎn)品線,并稱“這是40年來PC產(chǎn)品線首次全面革新”,同樣的智能體處理模式還將延展到各種設(shè)備上。
![]()
他說,計算機(jī)的這次革命,重要程度不亞于普通手機(jī)演變?yōu)橹悄苁謾C(jī),英偉達(dá)已為此制定產(chǎn)品路線圖,每一代架構(gòu)(Grace Blackwell、Vera Rubin、Rosa Feynman)都將配備臺式機(jī)、筆記本和工作站。
![]()
英偉達(dá)還發(fā)布了全球最強(qiáng)大的Windows平臺桌面AI超級計算機(jī)DGX Station,以及英偉達(dá)豪賭2000億美元市場的大招——專為智能體設(shè)計的Vera CPU。這正是英偉達(dá)為智能體運(yùn)行開拓的兩大全新市場。
![]()
Anthropic、OpenAI、SpaceX三家AI巨頭均率先部署Vera CPU。
在Q1財報期間,英偉達(dá)曾透露全新Vera CPU將開啟一個價值2000億美元的市場,預(yù)計Vera芯片收入將在本財年末達(dá)到200億美元,成為“第二大銷售貢獻(xiàn)者”。
今日,黃仁勛稱Vera CPU具有革命性意義,其產(chǎn)能爬坡令他非常滿意,“目前的訂單量已注定它將成為我們公司歷史上最快速、最成功的產(chǎn)品發(fā)布。”
“NVIDIA Vera是英特爾和AMD x86_64處理器有史以來最強(qiáng)大的競爭對手。”Phoronix CPU Benchmark Suite作者M(jìn)ichael Larabel評價說。
![]()
面向智能體部署,英偉達(dá)推出迄今最強(qiáng)模型Nemotron 3 Ultra、企業(yè)級智能體工具箱。其中,Nemotron 3 Ultra的智能體生產(chǎn)力測試分?jǐn)?shù)超過或打平了三個領(lǐng)先的國產(chǎn)智能體模型智譜GLM 5.1、月之暗面Kimi K2.6、阿里Qwen3.5。
![]()
面向物理AI,英偉達(dá)開源世界基礎(chǔ)模型Cosmos 3、自動駕駛推理模型Alpamayo 2 Super,并宣布成立Cosmos聯(lián)盟。
面向AI工廠,英偉達(dá)宣布Vera Rubin全面投產(chǎn),并掏出了幫AI工廠更穩(wěn)定、節(jié)能的兩大利器DSX OS和DSX MaxLPS。
黃仁勛也一如既往地曬了一下英偉達(dá)龐大的“朋友圈”,并繼續(xù)鞏固熱愛美食的人設(shè),特別感謝了在夜市的水果攤販,還給了花娘小館、富霸王豬腳餐廳等幾家飯店名字的特寫鏡頭。
![]()
在演講中,黃仁勛繼續(xù)飆新金句:
“實(shí)用AI時代已經(jīng)到來。”
“AI現(xiàn)在是利潤生成器、GDP生成器。”
“計算即收入。”
“買得越多,賺得越多。”
“Token已成為盈利的收入單位。”
“僅僅因為芯片更便宜就選擇錯誤的架構(gòu),是沒有意義的。”
![]()
黃仁勛認(rèn)為,在AI工廠時代,每產(chǎn)生1個token就能盈利,每瓦性能、可靠性和系統(tǒng)壽命才是核心財務(wù)杠桿。
AI工廠每吉瓦成本是200億~300億美元起步,現(xiàn)已攀升至500億~600億美元,不久后將達(dá)到800億~1000億美元。這些投資必須確保一次成功。
在黃仁勛看來,AI會減少工作崗位的說法“完全是無稽之談”,AI反而推動了軟件工程師需求的增長。
作為GTC慣例,英偉達(dá)的機(jī)器人生態(tài)全家福再次展出。
![]()
最后,在演講末尾,英偉達(dá)播放了由一群人形機(jī)器人、OpenClaw龍蝦、黃仁勛數(shù)字人共同參演的音樂MV。
![]()
一、英偉達(dá)自研PC芯片登場:3nm制程,最高1P算力,能跑1200億參數(shù)大模型
“時隔40年,微軟與英偉達(dá)將重新發(fā)明PC(個人計算機(jī))。”黃仁勛宣布,英偉達(dá)與微軟面向個人智能體時代重新構(gòu)想PC,推出為游戲和智能體而生的RTX Spark超級芯片。
![]()
RTX Spark超級芯片采用臺積電3nm工藝,內(nèi)置700億顆晶體管,提供128GB LPDDR5X統(tǒng)一內(nèi)存和1PetaFLOPSFP4 AI算力,號稱是“史上能效最高的RTX芯片”。
其中,Blackwell RTX GPU有6144個CUDA核心和第五代Tensor Core,并通過NVLink C2C芯片間互連技術(shù)連接到與聯(lián)發(fā)科合作開發(fā)的定制20核Grace CPU。
![]()
黃仁勛將RTX Spark稱作“世界上制造過的最神奇的芯片”,“英偉達(dá)100%的軟件棧都在其上運(yùn)行”。
RTX Spark融合了英偉達(dá)33年的創(chuàng)新成果,為全球首款專為個人智能體打造的Windows PC提供動力。英偉達(dá)CUDA可在RTX Spark上原生運(yùn)行。
搭載RTX Spark的PC,可以使用OptiX和DLSS渲染90GB超大型3D場景,使用英偉達(dá)Blackwell解碼器編輯12K 4:2:2視頻,運(yùn)行具有100萬個token上下文的1200億參數(shù)大語言模型,以及使用光線追蹤、DLSS和Reflex以1440p分辨率和每秒100幀以上的速度玩3A游戲。
以前使用PC,用戶要啟動應(yīng)用程序,點(diǎn)擊鼠標(biāo),輸入文字。現(xiàn)在使用RTX Spark和微軟Windows,用戶只需提出請求,電腦就能完成工作。
此外,Adobe為RTX Spark重新設(shè)計了Adobe Photoshop和Premiere的架構(gòu),新版本在創(chuàng)意工作流程中,可將AI、編輯、調(diào)色和特效的處理速度最高提升至2倍。
![]()
微軟與英偉達(dá)正在對整個PC進(jìn)行全面重塑,發(fā)布了面向智能體的全新三大Windows產(chǎn)品線,涵蓋筆記本電腦、臺式機(jī)、桌面超算。
搭載RTX Spark的筆記本電腦和緊湊型臺式機(jī)將于今年秋季推出。
筆記本電腦厚度僅為14mm,重量僅3磅,有14至16英寸多種尺寸選擇,可以24小時不間斷本地“養(yǎng)龍蝦”。
![]()
二、全球最強(qiáng)桌面級AI超算:748GB內(nèi)存,20P算力,能跑萬億參數(shù)模型
英偉達(dá)今日還推出了一款適用于Windows的桌面AI超級計算機(jī)DGX Station。
DGX Station for Windows由微軟合作開發(fā),基于英偉達(dá)DGX Station系統(tǒng)設(shè)計,搭載英偉達(dá)GB300 Grace Blackwell Ultra桌面級超級芯片,提供最高748GB統(tǒng)一內(nèi)存、20PetaFLOPSFP4算力、800GbpsConnectX-8 SuperNIC網(wǎng)絡(luò),與所有Windows軟件兼容,可運(yùn)行萬億參數(shù)級AI模型,并可同時運(yùn)行數(shù)百個智能體。
![]()
它支持額外配置一張RTX Pro 6000工作站級GPU,將前沿AI算力與光線追蹤可視化相融合,用于跨創(chuàng)意設(shè)計和工程應(yīng)用運(yùn)行智能體。
DGX Station for Windows預(yù)計將于今年第四季度由主流系統(tǒng)集成商上市。
黃仁勛預(yù)言,未來有一天,每個家庭都會有一臺AI超級計算機(jī),運(yùn)行著你所有的智能體和助手。
三、Vera CPU:88核、1.2TB/s內(nèi)存帶寬,專為智能體設(shè)計
傳統(tǒng)CPU追求每顆插槽的核心數(shù),切片、虛擬化、按小時出租。在智能體時代,CPU已成為GPU利用率的瓶頸,直接影響token吞吐量、時延與用戶體驗。
對此,英偉達(dá)推出其最先進(jìn)的CPU——專為智能體而生的Vera CPU。
![]()
Vera CPU采用LPDDR5X內(nèi)存(帶寬1.2TB/s)、支持PCIe Gen6,內(nèi)外帶寬均達(dá)同類最高性能CPU的2至3倍,也是首款在糾正多位錯誤的同時不損失帶寬的CPU。
它基于英偉達(dá)第二代可擴(kuò)展一致性架構(gòu),將88個英偉達(dá)定制Arm核心Olympus統(tǒng)一在一個單片Mesh網(wǎng)絡(luò)上,在智能體工作負(fù)載上實(shí)現(xiàn)了最高的單線程性能與最佳能效比。
其核心并未分散在多個Chiplet上,核心之間的通信速度比傳統(tǒng)CPU快50%。Vera支持內(nèi)存一致性,NVLink-C2C芯片間互聯(lián)可將GPU直連到架構(gòu),還可以將Vera擴(kuò)展到多個插槽,在CPU之間實(shí)現(xiàn)巨大頻寬。
與Grace CPU相比,Vera的每個核心每時鐘周期可多執(zhí)行50%的指令。
與配備DDR5的x86 CPU相比,Vera每個核心的帶寬多達(dá)3倍;與x86 CPU相比,峰值內(nèi)存延遲降低了40%,在檢索分析與沙箱執(zhí)行中保持核心供給及時。
![]()
在Python代碼分析、代碼編譯等常見智能體工具的行業(yè)標(biāo)準(zhǔn)基準(zhǔn)測試中,Vera的智能體沙箱性能是與x86 CPU競品性能的1.8倍。
![]()
該處理器有四大核心設(shè)計原則:領(lǐng)先的每時鐘指令數(shù)(IPC)/ 單線程性能、每核心帶寬、總帶寬以及能效。
Vera每時鐘可取指、解碼并執(zhí)行10條指令,IPC全球最高。
英偉達(dá)Olympus核心專為現(xiàn)代數(shù)據(jù)中心工作負(fù)載、分支密集型Python運(yùn)行時、工具調(diào)用和沙箱代碼執(zhí)行而優(yōu)化。
每顆核心均為吞吐量調(diào)優(yōu):神經(jīng)分支預(yù)測器可在每個周期評估兩個選定分支,10-Wide解碼引擎可在每個周期代入更多工作負(fù)載,大型亂序執(zhí)行引擎維持著指令的運(yùn)作,新型圖引擎的高階預(yù)取器可預(yù)測下一個數(shù)據(jù)路徑。
![]()
Vera片上高速互聯(lián)總線帶寬達(dá)3.4TB/s,無芯粒稅(chiplet tax),無跨片邊界損耗,所有核心可與其他任何核心及緩存無延遲通信,不存在調(diào)度沖突。
Vera CPU已進(jìn)入全面量產(chǎn),并將于今年秋季通過系統(tǒng)合作伙伴正式上市。
Anthropic、OpenAI、SpaceX均是Vera CPU的早期采用者。
![]()
在SQL 1TB基準(zhǔn)測試中,Vera CPU的SQL運(yùn)行速度達(dá)到競品的3倍。
![]()
Vera CPU正在為紐約證券交易所(NYSE)運(yùn)行實(shí)時流處理,實(shí)現(xiàn)了6倍的性能提升。
四、人形機(jī)器人參考設(shè)計:宇樹機(jī)身+Sharpa靈巧手,開箱即用
NVIDIA Isaac GR00T參考人形機(jī)器人是首款基于英偉達(dá)Jetson Thor和Isaac GR00T平臺構(gòu)建的開放人形機(jī)器人參考設(shè)計。
![]()
這個參考設(shè)計集成了宇樹H2 Plus人形機(jī)器人、Sharpa Wave五指靈巧手、英偉達(dá)Jetson Thor處理器以及Isaac GR00T軟件和工作流程,并預(yù)裝了英偉達(dá)GR00T 1.7人形機(jī)器人模型,開箱即用。
具體包括:
- 宇樹H2人形機(jī)器人底盤:身高近6英尺,重150磅,全身有31個自由度,用于人體尺度測試。
- 雙Sharpa Wave觸覺五指靈巧手:可實(shí)現(xiàn)22個自由度的靈巧操作,使機(jī)器人在身體和手部達(dá)到75個自由度。
- 多視角傳感器:包括一個頭戴式立體攝像頭(水平140度,垂直102度),用于近距離操作的腕部攝像頭,以及一個用于運(yùn)動跟蹤的慣性測量單元。
- 全身控制:手臂扭矩高達(dá)120N·m,腿部扭矩達(dá)360N·m,手臂額定有效載荷為7公斤,峰值有效載荷為15公斤,舉升和伸展能力更強(qiáng)。
- 英偉達(dá)Jetson AGX Thor T5000板載計算:配備NVIDIA Blackwell GPU,F(xiàn)P4 AI性能達(dá)2070TFLOPS,14核Arm CPU,128GB統(tǒng)一內(nèi)存,以及可配置的40至130瓦功率范圍,用于實(shí)時傳感器處理和機(jī)器人推理。
- 支持以太網(wǎng)、Wi-Fi 6、藍(lán)牙5.2、USB連接,并配備一系列麥克風(fēng)和揚(yáng)聲器,用于語音交互。
- 電池容量為15Ah,0.972kWh,續(xù)航時間約為3小時,可延長運(yùn)行時間。
- 遠(yuǎn)程緊急停止功能,可快速安全地脫離機(jī)器人。
宇樹科技已在官方公布Isaac GR00T參考人形機(jī)器人的全身配置:
![]()
今年年底,NVIDIA Isaac GR00T參考人形機(jī)器人將由宇樹科技提供。
NVIDIA Isaac GR00T開發(fā)者平臺還將支持宇樹G1人形機(jī)器人。針對宇樹G1的參考工作流程預(yù)計很快將在GitHub和Hugging Face上提供給機(jī)器人開發(fā)人員。
為什么要做這件事?
黃仁勛說,研究實(shí)驗室從人形機(jī)器人制造商那里獲得的機(jī)器人,尚未達(dá)到量產(chǎn)就緒狀態(tài),因此,實(shí)驗室將大量時間和精力花在使機(jī)器人的基本功能正常運(yùn)作上。
而一個能夠規(guī)模化開發(fā)、配備備用零件、開箱即用的平臺,將計算、軟件棧、手部和機(jī)身全部集成在一起,統(tǒng)一設(shè)計協(xié)同運(yùn)行,并配備完整的仿真能力,使研究實(shí)驗室能直接開箱使用,立即投入研究。
四、開源英偉達(dá)最強(qiáng)世界模型:5500億參數(shù),5倍速度、成本降低30%
英偉達(dá)致力于為全世界構(gòu)建開源模型,讓人人都能打造屬于自己的智能體。
Nemotron 3 Ultra是英偉達(dá)迄今最強(qiáng)的新一代開源基礎(chǔ)模型,也是面向自主智能體能力最強(qiáng)的模型,共有5500億個參數(shù)。
這是全球首個基于SSM(狀態(tài)空間模型)與專家混合(MoE)混合架構(gòu)的模型。
它的速度是同級別領(lǐng)先模型的5倍,完成相同智能體任務(wù)所需的運(yùn)行成本降低30%。
![]()
![]()
“無論是總浮點(diǎn)運(yùn)算量還是總推理時間,均優(yōu)于目前最具性價比的開源模型。”黃仁勛總結(jié)說。
目前英偉達(dá)正在研發(fā)Nemotron 4。
五、打造智能體工具包,智能體將芯片設(shè)計驗證提速40多倍
黃仁勛說,下面這張圖是本場演講中最重要的一張幻燈片,也是最核心的結(jié)論:
![]()
這是未來十年的應(yīng)用模式、計算模式,每家公司都會采用。
如何幫助企業(yè)安全地構(gòu)建和運(yùn)行智能體?為此,英偉達(dá)推出了企業(yè)級智能體工具包(NVIDIA Agent Toolkit for Enterprise AI)。
![]()
英偉達(dá)智能體工具包結(jié)合了大語言模型、智能體框架和企業(yè)級運(yùn)行時,能為企業(yè)內(nèi)部提供高度安全的環(huán)境。
所有智能體都可以使用基于NVIDIA CUDA-X庫(包括 cuDF、cuOpt、AI-Q、NeMo、PhysicsNeMo和CUDA-Q)的智能體Skills。
![]()
這些經(jīng)過驗證的英偉達(dá)智能體Skills可在Claude Code插件市場和Hermes Skills Hub中找到。
NVIDIA OpenShell是這些自主智能體的安全運(yùn)行時環(huán)境,為智能體操作提供獨(dú)立的沙箱、集中式策略執(zhí)行和治理管理網(wǎng)關(guān),并可在Ubuntu、Windows、Red Hat OpenShift等主流企業(yè)平臺上運(yùn)行。
黃仁勛說,他最喜歡的智能體應(yīng)用案例之一是芯片設(shè)計。
英偉達(dá)與Cadence合作,打造了一款芯片設(shè)計超級智能體。
![]()
通過協(xié)調(diào)寄存器傳輸級生成、測試平臺創(chuàng)建、回歸測試和調(diào)試,這個超級智能體可自動運(yùn)行數(shù)百次模擬和形式化檢查,可將原本耗時數(shù)周的工作壓縮到幾小時,驗證周期快了40多倍。
“英偉達(dá)擁有數(shù)千名芯片設(shè)計師。我們將引入數(shù)十萬名Cadence超級智能體與我們協(xié)同工作,加速公司發(fā)展。”黃仁勛說。
六、物理AI:全新世界模型、自動駕駛推理模型開源
物理AI最大的挑戰(zhàn)是數(shù)據(jù)。對此,英偉達(dá)推出一款面向物理AI的開源世界基礎(chǔ)模型Cosmos 3。
![]()
Cosmos 3基于混合Transformer架構(gòu),將視覺推理和跨文本、視頻、圖像、環(huán)境音效和動作的多模態(tài)生成功能整合到一個模型中,幫助開發(fā)者創(chuàng)建具有物理上下文的世界數(shù)據(jù)。
該模型是VANTAGE-Bench測試榜上排名第一的開放視覺語言模型。
開發(fā)者可針對不同形態(tài)和應(yīng)用場景對Cosmos 3進(jìn)行后訓(xùn)練(post-train),比如用于世界推理、合成數(shù)據(jù)、閉環(huán)仿真器或世界動作模型。
所有模型、代碼和訓(xùn)練方案均已在Hugging Face和GitHub上開放。
同時,英偉達(dá)宣布成立Cosmos聯(lián)盟(Cosmos Coalition),Agile Robots、Black Forest Labs、Runway、LightTricks、Skilled AI等部分頂尖AI實(shí)驗室正與英偉達(dá)共同開發(fā)下一代Cosmos。
![]()
面向自動駕駛領(lǐng)域,英偉達(dá)也推出了全新物理AI模型、框架、函數(shù)庫:
(1)Alpamayo 2 Super:一款擁有320億參數(shù)的開放自動駕駛推理模型,專為推理、規(guī)劃、標(biāo)注和評估設(shè)計。
(2)AlpaGym:一款開源閉環(huán)強(qiáng)化學(xué)習(xí)框架,讓開發(fā)者能夠在仿真環(huán)境中訓(xùn)練自動駕駛策略,模型動作能夠真實(shí)影響后續(xù)仿真結(jié)果。
(3)OmniDreams:一款基于Cosmos構(gòu)建的專用角色模型,可大規(guī)模生成稀有、逼真的長尾駕駛場景。
(4)全新Omniverse NeRF函數(shù)庫:能在單塊GPU上以25ms以內(nèi)的速度完成真實(shí)世界的重建與渲染,使開發(fā)者可實(shí)時評估模型的感知效果。
這些發(fā)布共同為自動駕駛開發(fā)者提供了一條更快速、更安全的L4自動駕駛實(shí)現(xiàn)路徑。
七、Vera Rubin已全面投產(chǎn)
今年年初發(fā)布的Vera Rubin,現(xiàn)已全面投產(chǎn)。
![]()
黃仁勛說,Vera Rubin是英偉達(dá)史上最具雄心的項目,全公司40000名工程師都參與其中。
Vera Rubin專為運(yùn)行智能體而生,是一套完整的分解式分布式智能體處理系統(tǒng),包含Vera Rubin NVL72系統(tǒng)、液冷Vera CPU機(jī)架、Vera BlueField-4 STX存儲和安全系統(tǒng)、Groq 3 LPX低延遲推理托架和Spectrum-X Ethernet Photonics網(wǎng)絡(luò)。
![]()
該平臺由中國臺灣超過150家供應(yīng)鏈生態(tài)合作伙伴參與,遍布數(shù)百個工廠。所有組件均通過極致協(xié)同設(shè)計(extreme co-design)打造。
英偉達(dá)為Vera Rubin打造的供應(yīng)鏈,規(guī)模是Grace Blackwell的2倍。
以前組裝一個 Grace Blackwell機(jī)架需要2小時,現(xiàn)在只需5分鐘。產(chǎn)能更高,出貨速度也大幅提升。
單個液冷Vera CPU機(jī)架容納256顆CPU,負(fù)責(zé)模型編排、內(nèi)存調(diào)度與工具調(diào)用。
![]()
在富士康與廣達(dá),Groq LPX逐步成形。256顆Groq LPU分布于16個托盤,片上靜態(tài)隨機(jī)存儲器(SRAM)帶寬高達(dá)40PB/s,實(shí)現(xiàn)超低時延。
Spectrum-X Ethernet Photonics是全球首款采用共封裝光器件的200Gb/s SerDes以太網(wǎng)交換機(jī),現(xiàn)已投入生產(chǎn)。
Vera BlueField-4 STX由BlueField-4加速,在芯片層面處理安全問題:DOCA Argus可將威脅檢測時間從分鐘縮短至毫秒;DOCA Vault可在機(jī)架規(guī)模上保護(hù)AI數(shù)據(jù)。
八、DSX:幫企業(yè)構(gòu)建和管理AI工廠,相同功耗下多塞40%的GPU
英偉達(dá)曾經(jīng)在計算機(jī)內(nèi)部設(shè)計一顆芯片,然后在計算機(jī)內(nèi)部仿真一個系統(tǒng),如今終于可以在數(shù)字框架、數(shù)字仿真器、數(shù)字世界中構(gòu)建這些龐大的系統(tǒng),在破土動工、投入真金白銀之前驗證一切。
黃仁勛解釋說,RTX對應(yīng)GPU,DGX對應(yīng)系統(tǒng),而DSX對應(yīng)基礎(chǔ)設(shè)施。
世界正在競相建設(shè)AI工廠芯片、機(jī)架、網(wǎng)絡(luò)、電力、冷卻、電網(wǎng)每一層都必須從頭到尾協(xié)同設(shè)計,因為“計算即收入”。
NVIDIA DSX是以最高效率和盈利能力設(shè)計、建設(shè)與運(yùn)營AI工廠的參考設(shè)計,致力于實(shí)現(xiàn)最低Token成本,并守護(hù)能源電網(wǎng)安全。
今日,英偉達(dá)推出適用于DSX平臺的全新AI工廠操作系統(tǒng)DSX OS和DSX MaxLPS。
DSX OS是一款模塊化、開源、可擴(kuò)展的基礎(chǔ)設(shè)施軟件,專為AI工廠運(yùn)營商設(shè)計,負(fù)責(zé)配置、運(yùn)營、監(jiān)控和修復(fù)基礎(chǔ)設(shè)施,將已安裝的系統(tǒng)轉(zhuǎn)化為可信賴的多租戶、高彈性、AI就緒的算力容量。
DSX OS開源組件的生態(tài)合作伙伴可接入自有軟件,并通過ISV(獨(dú)立軟件供應(yīng)商)生態(tài)加以擴(kuò)展。
![]()
DSX MaxLPS是一套專門設(shè)計的技術(shù)組合,能與Vera Rubin硬件的動態(tài)功耗特性協(xié)同配合,統(tǒng)籌優(yōu)化算力吞吐,幫助數(shù)據(jù)中心運(yùn)營商在相同功耗、電力預(yù)算下可多提供40%的GPU,每年可新增數(shù)十億美元的營收。
熱液冷卻技術(shù)在45℃下運(yùn)行,耗水更少、能耗更低,將更多電力導(dǎo)向創(chuàng)收算力;動態(tài)電力調(diào)配技術(shù)將電力從機(jī)架到機(jī)架靈活調(diào)度,回收閑置功耗,將其輸送至有工作負(fù)載的地方;機(jī)架內(nèi)削峰平滑技術(shù)抑制電流尖峰和功率浪涌,穩(wěn)定整個工廠的供電;智能體團(tuán)隊與DSX MaxLPS協(xié)作,持續(xù)協(xié)調(diào)冷卻與電力,以滿足工作負(fù)載需求。
結(jié)語:一切為了幫客戶實(shí)現(xiàn)最高利潤
2026年正成為AI發(fā)展史上極為重要的一年。智能體的拐點(diǎn)正在推動生產(chǎn)力大幅提升,創(chuàng)造巨大的商業(yè)機(jī)遇。
黃仁勛總結(jié)了英偉達(dá)構(gòu)建AI基礎(chǔ)設(shè)施的優(yōu)勢:
1、首個Token時延、首次推理啟動時延、訓(xùn)練啟動時延都更短。
2、每瓦吞吐量、每瓦Token數(shù)是世界頂級。僅僅因為芯片更便宜就選擇錯誤的架構(gòu),這不劃算。每瓦Token數(shù)才是關(guān)鍵,買得越多,賺得越多。
3、可靠性。英偉達(dá)已經(jīng)在超大規(guī)模下運(yùn)營很久,這些經(jīng)驗非常寶貴。
4、系統(tǒng)使用壽命。每隔幾個月,軟件行業(yè)就會涌現(xiàn)出新技術(shù)。英偉達(dá)的系統(tǒng)遍布全球,軟件開發(fā)者從英偉達(dá)CUDA起步,因此生態(tài)系統(tǒng)和資產(chǎn)的有效使用壽命自然會更長。如果資產(chǎn)壽命長,則總擁有成本(TCO)低。
正如黃仁勛強(qiáng)調(diào)的,英偉達(dá)已經(jīng)不僅僅是一家GPU公司和系統(tǒng)公司,而是一家基礎(chǔ)設(shè)施公司,一切都是為了幫客戶實(shí)現(xiàn)最大營收、最高利潤,并盡快實(shí)現(xiàn)目標(biāo)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.