隨著AI模型參數(shù)規(guī)模突破萬億量級,算力需求正在從單芯片堆疊向系統(tǒng)級協(xié)同轉(zhuǎn)型,傳統(tǒng)分布式訓練面臨通信開銷劇增和算力利用率下降等挑戰(zhàn)。為解決這一問題,超節(jié)點采用高速互聯(lián)協(xié)議和專用交換芯片,構(gòu)建高帶寬域(HBD),將數(shù)十到數(shù)百顆GPU芯片邏輯整合為統(tǒng)一編址、低延遲、高帶寬的協(xié)同計算系統(tǒng)。這一架構(gòu)在保留GPU物理獨立性的同時,帶來了類單機的編程與調(diào)度體驗,顯著提升了算力利用效率,為大規(guī)模模型訓練和推理提供了高性能的算力底座。近日,中興通訊發(fā)布《超節(jié)點技術(shù)白皮書》,提出以超節(jié)點為核心打造標準化“AI工廠”,通過系統(tǒng)級架構(gòu)創(chuàng)新,突破算力極限與能效瓶頸,為AI基礎(chǔ)設(shè)施的可持續(xù)發(fā)展提供新路徑。
![]()
架構(gòu)創(chuàng)新,OEX正交無背板互聯(lián),
零線纜
在硬件層面,白皮書重點闡述了中興通訊自研的OEX(Orthogonal Electrical eXchange)正交無背板互聯(lián)交換架構(gòu)。OEX(Orthogonal Electrical eXchange)正交無背板互聯(lián)是中興通訊在超節(jié)點架構(gòu)中提出的零線纜高速互聯(lián)方案,核心是計算與交換托盤垂直正交對插、取消傳統(tǒng)高速線纜與集中式背板,通過短路徑直連實現(xiàn)高密、低損、易運維的算力互聯(lián),適配 AI 數(shù)據(jù)中心大規(guī)模 GPU 協(xié)同計算需求該架構(gòu)通過物理設(shè)計的根本性創(chuàng)新,具體呈現(xiàn)四大核心亮點:
? 高密集成:突破物理空間極限。采用計算托盤與交換托盤垂直交叉的無線纜互聯(lián)設(shè)計,徹底消除了機柜內(nèi)部成千上萬根高速線纜,極大釋放了機柜空間,實現(xiàn)了單位空間算力密度的飛躍。
? 高可靠:保障信號完整與系統(tǒng)穩(wěn)定。通過正交無背板互聯(lián)顯著降低通信損耗,大幅降低誤碼率。極短的板間互聯(lián)路徑確保了大規(guī)模集群通信的高速與穩(wěn)定。
? 簡化運維:極簡架構(gòu)提升可維護性。無線纜設(shè)計從根本上減少了因線纜松動、老化或連接器故障導致的宕機風險。極簡的物理架構(gòu)將系統(tǒng)平均故障修復時間(MTTR)從小時級縮短至分鐘級,極大提升了系統(tǒng)的可維護性和運行效率。
? 開放互聯(lián):自研芯片多協(xié)議兼容。依托自研的“凌云”大容量交換芯片,系統(tǒng)支持TB級互聯(lián)帶寬與百納秒級時延,并全面兼容國內(nèi)外主流標準及專業(yè)定制化互聯(lián)協(xié)議。
維度
技術(shù)細節(jié)
性能 / 價值
高密集成
垂直正交排布 + 零線纜釋放空間,支持多 GPU 高密度部署
單位空間算力密度顯著提升,適配萬卡級集群擴展
信號完整性
極短互聯(lián)路徑(相比線纜縮短 90%+)、低損耗材料、阻抗精準控制
大幅降低誤碼率,保障 224G PAM4 等高速信號穩(wěn)定傳輸
可靠性
減少線纜松動、連接器故障等單點失效風險
MTTR 從小時級降至分鐘級,提升系統(tǒng)可用性
開放兼容
凌云芯片支持 PCIe 5.0、CCIX、NVLink 等主流協(xié)議
兼容英偉達 GB200/GB300 等 AI 服務(wù)器,適配定制化互聯(lián)需求
能效與成本
減少線纜與背板功耗(約 15%-20%),簡化物料與組裝
降低 TCO,提升系統(tǒng)能效比(PUE)
與傳統(tǒng)方案對比
方案
OEX 正交無背板互聯(lián)
傳統(tǒng)線纜 + 背板方案
正交背板方案(如英偉達 Rubin)
互聯(lián)形態(tài)
計算 / 交換托盤垂直直連,零線纜、無集中背板
線纜連接計算板與背板,背板連接交換板
計算板與正交背板垂直對插,無中間線纜
復雜度
極簡,無冗余線纜 / 背板
高,線纜達數(shù)千至數(shù)萬根,管理維護復雜
中高,依賴超高層背板 PCB 工藝
信號損耗
極低(路徑最短)
高(線纜 + 背板雙重損耗)
低(背板路徑短,但存在層間損耗)
運維難度
低,模塊化插拔,MTTR 分鐘級
高,線纜排查 / 更換耗時
中,背板故障需整機停機
算力密度
最高
中高
典型應(yīng)用
中興超節(jié)點 AI 工廠,適配大規(guī)模模型訓練 / 推理
傳統(tǒng)數(shù)據(jù)中心,中小規(guī)模算力集群
英偉達 Rubin Ultra、華為 Atlas950 等高端算力平臺
應(yīng)用場景與落地進展
- 核心場景:AI 大模型訓練(萬億參數(shù)級)、超大規(guī)模分布式推理、高密度智算中心建設(shè),尤其適配 “AI 工廠” 標準化部署需求
落地情況:2026 年 1 月中興發(fā)布《超節(jié)點技術(shù)白皮書》正式推出,已納入其全棧智算平臺,適配百卡到萬卡平滑擴展,支持統(tǒng)一編址與類單機編程體驗。
- 生態(tài)適配:兼容國內(nèi)外主流 AI 芯片與服務(wù)器,可與光互聯(lián)協(xié)同,構(gòu)建 “電 + 光” 混合高速互聯(lián)網(wǎng)絡(luò),滿足跨機柜大規(guī)模擴展需求
![]()
技術(shù)挑戰(zhàn)與行業(yè)趨勢
- 核心挑戰(zhàn)
超高層 PCB(如 78 層)與高精度工藝(激光鉆孔、阻抗控制)要求高,良率與成本控制難度大。
正交接口的信號一致性與熱設(shè)計需精準優(yōu)化,適配 224G + 高速信號傳輸。
模塊化兼容性需覆蓋多廠商芯片與協(xié)議,考驗生態(tài)整合能力 。
- 行業(yè)趨勢
正交無背板 / 零線纜成為 AI 算力集群主流方向,英偉達 Rubin Ultra、華為 Atlas950 等均采用類似架構(gòu)。
高速 PCB 材料(如 M9Q)、正交連接器(如 Crossbow)等供應(yīng)鏈加速成熟,支撐技術(shù)規(guī)模化落地。
資料獲取渠道
官方白皮書:中興通訊《超節(jié)點技術(shù)白皮書》(2026 年 1 月版),含 OEX 架構(gòu)示意圖、性能測試數(shù)據(jù)、部署指南。
加客服申請中興通訊《超節(jié)點技術(shù)白皮書》(2026 年 1 月版)
閱讀更多內(nèi)容長按二維碼識別
▼歡迎“點贊”“分享” 在評論區(qū)留下您的看法▼
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.