【環(huán)球網(wǎng)科技報(bào)道 記者 張陽】當(dāng)前,人工智能產(chǎn)業(yè)正在經(jīng)歷從生成式AI向智能體(Agentic AI)時(shí)代的躍遷。當(dāng)大模型參數(shù)規(guī)模突破萬億級(jí)、訓(xùn)練數(shù)據(jù)量達(dá)到10萬億Token量級(jí)時(shí),算力需求呈現(xiàn)出十倍乃至百倍的爆發(fā)式增長(zhǎng)。然而,傳統(tǒng)依賴服務(wù)器堆疊與以太網(wǎng)聯(lián)接的集群架構(gòu),正遭遇規(guī)模擴(kuò)張與效率衰減的結(jié)構(gòu)性矛盾——集群規(guī)模越大,算力利用率反而越低,訓(xùn)練中斷頻率越高。
Meta在其Llama 3.1技術(shù)論文中披露的數(shù)據(jù)極具警示意義:在1.6萬卡H100集群的54天訓(xùn)練過程中,累計(jì)中斷419次,平均每天近8次故障。這一數(shù)據(jù)揭示了傳統(tǒng)架構(gòu)的致命短板:當(dāng)計(jì)算節(jié)點(diǎn)通過低速網(wǎng)絡(luò)簡(jiǎn)單聯(lián)接時(shí),通信瓶頸、內(nèi)存碎片化、調(diào)度開銷等問題會(huì)隨著規(guī)模擴(kuò)張呈指數(shù)級(jí)惡化。
在此背景下,華為于MWC2026巴塞羅那首次向海外展示的Atlas 950 SuperPoD、TaiShan 950 SuperPoD等多款超節(jié)點(diǎn)產(chǎn)品及解決方案,標(biāo)志著算力基礎(chǔ)設(shè)施建設(shè)正從“物理堆疊”走向“邏輯統(tǒng)一”的范式轉(zhuǎn)換。通過自研靈衢(Unified Bus)互聯(lián)協(xié)議,華為將最多8192張昇騰NPU卡整合為單一計(jì)算實(shí)體,使萬卡級(jí)集群在邏輯上如同一臺(tái)計(jì)算機(jī)協(xié)同工作。這種“集群+超節(jié)點(diǎn)”的系統(tǒng)級(jí)架構(gòu)創(chuàng)新,本質(zhì)上是對(duì)算力組織方式的重構(gòu),搭配全維度的開源開放生態(tài)布局,為全球算力產(chǎn)業(yè)發(fā)展提供了又一種選擇。
![]()
靈衢協(xié)議的技術(shù)突破:重新定義超節(jié)點(diǎn)的三大核心要素
超節(jié)點(diǎn)并不是將更多的計(jì)算單元進(jìn)行連接,其技術(shù)內(nèi)涵有著嚴(yán)格的界定標(biāo)準(zhǔn)。華為提出的“超大帶寬、超低時(shí)延、內(nèi)存統(tǒng)一編址”三大核心要素,為行業(yè)提供了重要的技術(shù)參考框架。
在帶寬層面,Atlas 950 SuperPoD采用獨(dú)創(chuàng)的UB-Mesh遞歸直連拓?fù)渚W(wǎng)絡(luò)架構(gòu),支持單板內(nèi)、單板間和機(jī)架間的NPU全互聯(lián),靈衢全光互聯(lián)帶寬達(dá)到16.3PB/s。這一指標(biāo)達(dá)到業(yè)界水平的62倍,徹底解決了大規(guī)模并行計(jì)算中的數(shù)據(jù)搬運(yùn)瓶頸。
![]()
在時(shí)延層面,傳統(tǒng)以太網(wǎng)架構(gòu)下跨節(jié)點(diǎn)通信時(shí)延通常在微秒級(jí),而靈衢協(xié)議將RTT通信時(shí)延從7微秒降至3微妙,實(shí)現(xiàn)50%優(yōu)化。對(duì)于金融風(fēng)控等要求響應(yīng)時(shí)間在10毫秒以下的場(chǎng)景,這種時(shí)延突破具有決定性意義。
在內(nèi)存架構(gòu)層面,Atlas 950 SuperPoD實(shí)現(xiàn)1152TB共享內(nèi)存池,通過內(nèi)存統(tǒng)一編址技術(shù),數(shù)據(jù)可在計(jì)算節(jié)點(diǎn)間快速調(diào)取,避免了傳統(tǒng)架構(gòu)中因數(shù)據(jù)搬運(yùn)造成的算力空轉(zhuǎn)。FP8算力達(dá)8EFLOPS、FP4算力16EFLOPS的性能指標(biāo),分別達(dá)到業(yè)界水平的6.7倍。
值得注意的是,華為的技術(shù)演進(jìn)遵循明確的版本迭代路徑。2025年3月推出的Atlas 900超節(jié)點(diǎn)基于靈衢1.0,滿配384卡,已在互聯(lián)網(wǎng)、電信、制造等行業(yè)商用部署數(shù)百套,驗(yàn)證了技術(shù)的成熟度。此次展示的Atlas 950 SuperPoD基于優(yōu)化升級(jí)的靈衢2.0,最大支持8192卡全互聯(lián),實(shí)現(xiàn)了從“可用”到“領(lǐng)先”的跨越。
全場(chǎng)景產(chǎn)品矩陣:智算與通算的雙輪驅(qū)動(dòng)
值得注意的是,華為此次展示的不僅是AI超節(jié)點(diǎn),還包括全球首款通算超節(jié)點(diǎn)TaiShan 950 SuperPoD。這反映出一個(gè)關(guān)鍵趨勢(shì):未來算力基礎(chǔ)設(shè)施必須兼顧通用計(jì)算與智能計(jì)算的雙重需求。
在智算領(lǐng)域,Atlas 950 SuperPoD定位為面向超大規(guī)模AI計(jì)算任務(wù)的全液冷解決方案,采用正交架構(gòu)與零線纜電互聯(lián)設(shè)計(jì),結(jié)合液冷接頭浮動(dòng)盲插技術(shù)實(shí)現(xiàn)零漏液,光模塊液冷可靠性提升一倍。針對(duì)傳統(tǒng)風(fēng)冷機(jī)房環(huán)境,Atlas 850E作為業(yè)界首個(gè)企業(yè)級(jí)風(fēng)冷AI超節(jié)點(diǎn)服務(wù)器,支持8到1024卡靈活擴(kuò)展,填補(bǔ)了風(fēng)冷條件下的超節(jié)點(diǎn)部署空白。
在通算領(lǐng)域,TaiShan 950 SuperPoD作為業(yè)界首款通算超節(jié)點(diǎn),具備百納秒級(jí)超低時(shí)延、TB級(jí)超大帶寬和48TB內(nèi)存池化能力,為數(shù)據(jù)庫(kù)、虛機(jī)熱遷移、大數(shù)據(jù)處理等傳統(tǒng)通算場(chǎng)景開辟了性能提升的全新路徑。配合TaiShan 500、TaiShan 200等系列服務(wù)器,形成了高、中、低全梯度的通算產(chǎn)品體系。
開源開放戰(zhàn)略:從技術(shù)領(lǐng)先到生態(tài)共贏
技術(shù)創(chuàng)新的價(jià)值最終需要通過生態(tài)繁榮來實(shí)現(xiàn)。華為在此次展示中重申的開源開放戰(zhàn)略,是其算力底座能夠獲得全球認(rèn)可的關(guān)鍵支撐。
在基礎(chǔ)軟件層面,openEuler操作系統(tǒng)社區(qū)已匯聚超2100家企業(yè)與機(jī)構(gòu),裝機(jī)量突破1600萬套,成為全球領(lǐng)先的開源操作系統(tǒng)社區(qū)。2021年華為將openEuler捐贈(zèng)給開放原子開源基金會(huì)后,仍保持持續(xù)貢獻(xiàn)。
在AI軟件棧層面,華為于2025年底實(shí)現(xiàn)CANN異構(gòu)計(jì)算架構(gòu)的全面開源開放,算子庫(kù)、加速庫(kù)、圖計(jì)算、編程語言等27個(gè)軟件包、37個(gè)代碼倉(cāng)全部向開發(fā)者開放。目前CANN已支持65+全球主流開源大模型、50+開源項(xiàng)目,代碼貢獻(xiàn)行超過百萬行,并與PyTorch、vLLM、xLLM、SGlang、Triton等主流開源社區(qū)實(shí)現(xiàn)深度適配。
這種開源開放策略的意義在于:通過分層解耦的架構(gòu)設(shè)計(jì),各行業(yè)客戶可以基于開源社區(qū)自主開發(fā)高性能算子,實(shí)現(xiàn)真正的自主創(chuàng)新。對(duì)于運(yùn)營(yíng)商、金融、制造等關(guān)鍵行業(yè)而言,這意味著不再受制于封閉的技術(shù)體系,而是能夠基于開放的算力底座構(gòu)建自有能力。
全球算力格局的新變量
MWC26上華為超節(jié)點(diǎn)產(chǎn)品的海外首秀,發(fā)生在全球AI算力競(jìng)爭(zhēng)格局深刻調(diào)整的背景下。為世界提供“新選擇”,意味著在當(dāng)前以某種架構(gòu)為主導(dǎo)的算力版圖之外,畫出了另一條清晰可行的路徑。這條路徑不是簡(jiǎn)單的替代,而是基于對(duì)AI時(shí)代算力本質(zhì)需求的理解,提供的一種更高效、更開放、更具韌性的可能性。
從產(chǎn)業(yè)視角審視,超節(jié)點(diǎn)技術(shù)的成熟與商用,正在推動(dòng)三個(gè)層面的結(jié)構(gòu)性變化:其一,算力建設(shè)從“芯片中心主義”轉(zhuǎn)向“系統(tǒng)架構(gòu)優(yōu)化”,互聯(lián)協(xié)議、拓?fù)浣Y(jié)構(gòu)、散熱設(shè)計(jì)等系統(tǒng)工程能力的重要性顯著提升;其二,算力供給從“標(biāo)準(zhǔn)化產(chǎn)品”轉(zhuǎn)向“場(chǎng)景化解決方案”,不同規(guī)模、不同冷卻條件、不同業(yè)務(wù)負(fù)載的客戶都能獲得適配方案;其三,算力生態(tài)從“封閉壟斷”轉(zhuǎn)向“開放共贏”,開源社區(qū)成為技術(shù)創(chuàng)新與產(chǎn)業(yè)協(xié)作的核心載體。
MWC2026的展示,標(biāo)志著這一技術(shù)選擇正式走向全球市場(chǎng)。超節(jié)點(diǎn)時(shí)代已經(jīng)開啟,堅(jiān)實(shí)的算力底座,正為智能世界的下一程鋪路。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.