網易首頁 > 網易號 > 正文申請入駐

從拼參數到拼架構：國產算力加速淬煉！

2026-06-08 08:37:29　來源: 通信產業報

北京舉報

分享至

算力產業的競爭是一場長期博弈。

6月1日，英偉達CEO黃仁勛在臺北國際電腦展上宣布，其下一代AI超級芯片平臺VeraRubin已全面投產，將于今年秋季開始發貨。幾乎在同一時間，2026世界智能產業博覽會在天津舉行，華為展出的Atlas 900 A3 SuperPoD昇騰384超節點正式落地天津武清區。而就在十天前，央視財經報道了我國最大規模科學智能計算集群在河南鄭州投入使用，6萬張國產AI加速卡正在高速運行，支撐著從氣象預報到新材料研發的各類科研任務。

這三條看似獨立的新聞，勾勒出全球算力產業競爭的最新圖景。一邊是英偉達繼續引領全球高端算力技術迭代，另一邊是中國算力產業正在加速崛起。

國產算力駛入快車道

2025年是中國算力產業的一個關鍵節點。根據IDC發布的《2025年度中國云端AI加速器市場報告》，2025年中國AI加速卡總出貨量約為400萬張，其中國產廠商合計出貨約165萬張，市場份額約41%。與此前英偉達在中國市場占據約95%份額的格局相比，變化明顯。

這一數字背后，是中國算力產業從“能不能造”到“能不能用”再到“好不好用”的階段性跨越。但需要指出的是，“跨越”不等于“趕超”，在單卡性能、軟件生態和供應鏈等維度，國產算力與國際領先水平仍有差距。

算力的競爭從來不是單卡的較量。英偉達的優勢不僅在于GPU本身，更在于其圍繞CUDA構建的完整軟件生態和開發者社區。而國產算力走出了一條以系統換性能的差異化路徑，在單卡性能存在差距的情況下，通過高速互聯技術將多張芯片整合為統一的邏輯計算單元，以集群協同彌補單點不足。

2026年世界智能產業博覽會期間，華為Atlas 900 A3 SuperPoD昇騰384超節點正式落地天津武清區。該超節點集成384顆昇騰NPU和192顆鯤鵬CPU，通過全對等高速總線互聯，單集群BF16稠密算力達到300 PFLOPs，約為英偉達GB200 NVL72的1.7倍。

按照華為方面的數據，該超節點截至2025年9月已累計部署300多套，服務于互聯網、金融、運營商、電力、制造等行業的20多個客戶。這一系統架構創新，成為國產算力突圍的重要方向。

與此同時，產業鏈上游也迎來重要進展。4月，我國最大規模科學智能計算集群在河南鄭州的國家超算互聯網核心節點投入使用，由6萬張國產AI加速芯片組成，支撐從氣象預報到新材料研發的各類科研任務。4月3日，粵港澳大灣區首個基于平頭哥真武810E芯片的萬卡智算集群在廣東韶關正式上線，由中國電信廣東公司與阿里云聯合建設，計劃擴容至10萬卡規模。

百舸爭流：中國算力生態的多元格局

目前，全球算力產業已從英偉達“一超多強”的格局演變為多極化競爭態勢。與海外主流算力生態相比，中國算力生態在技術路線和發展模式上呈現出鮮明的多元特色，不同廠商基于各自的技術積累和市場定位，走出了不同的發展道路。

華為昇騰系是目前國產算力生態中技術布局最全面的陣營。華為實現了從芯片設計、服務器到互聯技術、軟件棧的全鏈條自研。昇騰超節點架構已成為國產大模型訓練的主流方案之一。截至2025年5月，鯤鵬+昇騰生態已匯聚超過665萬開發者、8800多家合作伙伴，完成23900多個解決方案認證。華為已開放靈衢互聯協議2.0，支持產業伙伴構建基于該協議的超節點系統。

海光x86系提供了另一條技術路線。海光信息基于x86架構的DCU能夠兼容CUDA生態，降低用戶遷移成本。根據IDC數據，海光2025年AI加速卡出貨量約8.3萬張，市場份額約2%。在國產AI加速卡市場中，海光出貨量占比約5%。

寒武紀系專注于云端推理和邊緣計算領域。思元370已在阿里云推理場景中得到應用，截至2025年Q2承擔了阿里云約60%的推理需求。思元590則于2026年初實現全場景規模出貨。2025年寒武紀AI加速卡出貨量約11.6萬張，與百度昆侖芯并列國產第三。

百度昆侖芯系和阿里平頭哥系依托各自的互聯網生態，實現了算力與應用的深度融合。IDC數據顯示，昆侖芯2025年出貨量11.6萬塊，已成功點亮國內首個三萬卡集群。昆侖芯計劃2026年上市256卡互聯的“天池256超節點”，2026年下半年推出512卡超節點。平頭哥方面，截至2026年2月，自研AI芯片真武810E已累計規模化交付47萬顆。海光DCU在科學計算和通用AI領域持續放量。

此外，中科曙光系在超算與智算集群建設運營方面經驗豐富；沐曦、天數智芯等新興廠商也在特定技術領域逐步放量。這種多元化的發展格局形成了相對良性的競爭環境，推動了算力產業的迭代和技術路徑的探索。

從“并跑”到“領跑”的開端

盡管國產算力取得了階段性進展，但客觀來看，與國際先進水平相比仍存在明顯差距。

一是單卡性能與國際頂尖水平仍有代差。英偉達下一代AI超級芯片平臺Vera Rubin已于2026年6月宣布全面投產，秋季開始發貨。根據此前披露的信息，Rubin平臺在FP4精度下的推理性能較Blackwell提升5倍。預計2027年上半年推出的Vera Rubin Ultra將進一步形成新的性能壓力。此外，HBM高帶寬內存、先進封裝等關鍵技術仍依賴進口，產能受到一定限制。

二是生態碎片化問題依然突出。國內各算力廠商采用不同的技術路線和軟件棧，開發者需要針對不同平臺進行適配。雖然華為已開放靈衢互聯協議2.0，但整體而言，國產算力尚缺乏統一的軟件標準和開發者生態。生態的碎片化影響了用戶體驗，也制約了國產算力的大規模推廣。

三是推理算力正成為新的競爭焦點。TrendForce集邦咨詢的研報顯示，以北美五大CSP的整柜式方案估算，2026年AI推理算力年增約122%，而訓練算力年增約56%，推理增速超過訓練一倍以上。國產芯片在推理領域雖有一定基礎，但在高并發、低時延等場景仍需進一步優化。

因此，在相關專家看來，面向未來，中國算力生態的持續發展需要在以下幾個方向著力。

一是推動技術路線的開放與協同。華為開放靈衢互聯協議是一個良好開端，未來應進一步推動軟件棧的開放和標準化，減少生態碎片化帶來的重復建設。

二是堅持應用驅動。中國擁有全球最大的AI應用市場，應鼓勵算力廠商與行業用戶深度合作，在自動駕駛、生物醫藥、智能制造等領域打造標桿應用，通過大規模應用帶動技術迭代。

三是加強產業鏈協同創新。算力產業涉及芯片設計、制造、封裝、測試、服務器、軟件等多個環節，需要建立產業鏈協同機制，逐步突破HBM內存、高速光模塊、先進封裝等關鍵技術瓶頸。目前400G/800G光模塊所需的100G EML芯片等核心器件仍高度依賴進口，國產化率約5%～20%。

四是穩步推進國際化布局。鼓勵有條件的企業參與全球算力市場競爭，逐步提升國產算力生態的國際影響力。

2026年是中國算力產業發展的重要節點。經過多年積累，中國已建立起了相對完整的自主可控算力體系，打破了海外廠商在部分領域的壟斷。算力產業的競爭是一場長期博弈。國產算力在系統架構創新和集群部署方面走在了前列，但在單卡性能、軟件生態和供應鏈自主性等維度仍需持續突破。未來幾年，如何在保持系統優勢的同時補齊單點和生態短板，將決定國產算力能否實現從“并跑”到“領跑”的真正跨越。

采寫：黨博文

圖表：曙念

編輯：曉燕

指導：辛文

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.