![]()
文|白 鴿
編|王一粟
“如果DeepSeek先在華為平臺上發布,那對我們來說將是災難性的。”4月15日,英偉達CEO黃仁勛在接受Dwarkesh Patel的播客專訪時,說了一句分量很重的話。
而現在,黃仁勛口中的災難正逐漸演變成為現實。
4月24日,DeepSeek V4預覽版正式發布并開源,Pro版1.6萬億總參數、百萬token上下文,在Agent、數學推理、世界知識等維度登頂開源模型第一梯隊。
![]()
(圖片來源:DeepSeek微信公眾號)
幾乎同一時間,華為也正式宣布,昇騰950、A3系列超節點同步完成DeepSeek V4全版本“發布即適配”與全鏈路優化。
顯然,這不是一次普通的模型發布與芯片適配,而是中國大模型+中國算力的歷史性會師。
更關鍵的是,在DeepSeek V4的技術報告中,首次將昇騰NPU與英偉達GPU并列寫入硬件驗證清單,明確細粒度EP(專家并行)方案在兩大平臺均完成驗證。
這是DeepSeek歷史上首次將中國AI芯片與英偉達GPU并列寫入硬件驗證清單,確立對等地位。這也意味著,中國算力不再是海外生態的補充選項,而是與全球頂級硬件平起平坐的核心選擇。
顯然,當全球AI算力長期被英偉達CUDA生態壟斷、大模型訓練與推理高度依賴海外硬件時,一個被無數人期待的“中國版AI算力生態”正在悄然成型。
那么,中國AI算力生態,究竟是如何掀了英偉達那張坐了十幾年的“桌子”?
中國AI算力,不做CUDA仿制品
“一卡難求,包括我自己,我們雖然生產卡,但是我想用卡也很難。”華為昇騰專家在此前媒體溝通會上表示,如此坦誠得令人意外。
這份坦誠,其實也揭示了昇騰乃至整個中國AI算力產業曾經面臨的真實困境:擁有算力硬件,并不等于擁有生態,即便如華為,在自家生態的建設初期,也同樣面臨“有卡難用”的窘境。
時間拉回2018年,昇騰自己的AI框架CANN初生。
用華為昇騰專家的話說,那時的昇騰深知自己的硬件和軟件“是不完美的”。
而早期的AI競爭主要聚焦在框架層面,大家都在討論哪種框架更好用。但后來,所有人都意識到,真正的生態護城河是CUDA,而CUDA的背后,是英偉達的GPU。
因此,華為逐漸看清:“根本的根本其實還是芯片,因為英偉達的生態其實是構建在GPU上,CUDA是使能GPU,CANN是使能NPU的。”
在不斷的探索與妥協中前行多年后,昇騰在2025年做出了一個“痛下決心”的決定:必須從根本上解決生態問題。
當然,這個決心,也并非憑空而來,是市場的一次次“救援”與“警醒”,推動了這場變革。
ChatGPT的浪潮、DeepSeek的崛起、以及“龍蝦”(OpenClaw)引爆的Agent熱潮,每一次AI的范式革新,都讓昇騰看到自身在架構靈活性、算力配比、編程方式上的不足。
例如,為應對Agent帶來的Token算力爆發,昇騰“無論如何拼盡全力把FP8、FP4提前弄出來”,因為新的低精度格式能為客戶帶來翻倍的算力價值。
決心易下,但道路難行。想要構建一個能與CUDA生態競爭的全新體系,無異于在高速行駛的汽車上更換發動機。
彼時,面對英偉達CUDA構筑的深厚護城河,業界曾有過“仿制”的聲音——做一個CUDA的“復制品”似乎是一條捷徑。
但華為昇騰專家明確否定了這條路:“如果仿一個CUDA,做出來的其實就是CUDA 2號。一旦出現危機時刻,我們可能什么都不能用了。”
于是,一場痛定思痛的自我革命開始了。
華為決定堅持走自己的路,把底層的虛擬指令集、編譯器、運行時能力全部掌握在自己手里。這就像在別人的地基上蓋房子,永遠不如自己打地基來得穩固。
軟硬一體全面革新,用開源開放重構地基
想要掀翻英偉達的桌子,光有決心是不夠的,畢竟英偉達早已經構筑了從硬件GPU到軟件CUDA生態的全棧式核心競爭力。
因此,中國AI算力想要突圍,就需要既有能打的硬件產品,還要有與之媲美的軟件生態。
硬件層面,就不得不提到昇騰最新的產品——Ascend 950。
![]()
2025年9月,昇騰950在華為全聯接大會上亮相/截圖自@華為
當前,隨著DeepSeek V4大模型、OpenClaw等Agent智能體的爆發,對算力提出了更極致的要求:更低的精度(FP8/FP4)、更強的長序列處理能力、以及對Token推理的極致優化。
此背景下,昇騰在硬件層面也進行了大刀闊斧的改革,尤其是在昇騰950芯片上。
一方面,增加對SIMT編程支持,即針對950芯片,昇騰新增了SIMT(單指令多線程)編程支持,細化了Cache Line粒度。
這一改變直接提升了可編程性和性能表現,解決了以往編程靈活性不足的問題。
另外,昇騰950還全面支持mxFP4/mxFP8低精度數據格式,這不僅是為了適配大模型特征,更是為了在同等算力下實現Token吞吐量的翻倍,直接提升客戶的性價比。
硬件層面大刀闊斧的改革,也就使得,昇騰在特定場景(如多模態生成、推薦)上已展現出性能優勢,甚至達到“2倍、3倍”于業界水平。
這對于客戶來說,就是真金白銀的性價比。而這無疑也給昇騰芯片的市場帶來驚人的回報。
華為昇騰專家分享了兩個生動的案例:
一是客戶測試最新的昇騰950后,“測了不到一個禮拜說可以了,可以下單了”。
二是一些此前因顧忌國際壓力而猶豫的客戶,現在“主動聯系我們”,“跑到深圳找我們簽單”。客戶的評價最直接:“轉了一圈發現還是你們最好。”
如果說950芯片是昇騰的“心臟”,CANN就是昇騰的“靈魂”。
據了解,在軟件層面,CANN(異構計算架構)也經歷了“脫胎換骨”的改造,昇騰選擇了一條最艱難,但也最徹底的路,即重構CANN架構,全面開源開放。
開源開放到底開的是什么?“其實沒有那么復雜,就是把我們這一套系列原來像麻花團一樣團在一起的東西,一塊一塊結構化的拆開。每一塊的能力對外都方便的讓人看的到,能編程的時候能調用的到,并且代碼開源。”華為昇騰專家的這段話,道出了本質。
過去的CANN可能是一個高效但封閉的黑盒,而現在,他們要將其變成一個透明、可插拔、可參與的樂高積木。這項工作“不亞于把軟件重寫一遍”,華為昇騰專家透露,團隊原本計劃用一年半時間完成的架構解耦,最終在“華為式”的壓強投入下,僅用4個月便宣告完成。
在具體的重構策略上,是在底層虛擬指令集等核心層堅持自研,確保自主根基;在上層編程接口(如Triton等)全力兼容主流開發習慣,降低開發者遷移門檻。
用華為昇騰專家的話說,是“堅持走自己的路”,同時“尊重業界的開發使用習慣”。
但生態建設不是自說自話。因此,昇騰選擇了主動融入全球主流開源社區,目前昇騰已與Triton、PyTorch、vLLM等90多個主流AI開源社區實現深度對接。
這個過程極為不易,華為昇騰專家分享了一個細節:為了讓Triton社區(來自OpenAI)原生支持昇騰,團隊曾從早晨8點談到晚上10點多,用技術語言說服對方。
最終,昇騰成為了“國內首個Triton原生認證的后端”,并推動這些社區在發布版本前,將昇騰硬件納入其CI(持續集成)測試體系。這意味著,昇騰從“外部插件”變成了“內部原生支持”。
如果說芯片是肌肉,CANN就是神經系統。現如今,華為把CANN進行了分層解耦,像搭積木一樣讓開發者可以靈活調用。更重要的是,它開始全面兼容業界主流的開發習慣。
繁榮生態,從“獨角戲”到“大合唱”
技術再先進,如果開發者用不起來,生態就是空中樓閣,“只有讓開發者把昇騰用得更順、想得更遠、跑得更快,生態才能真正繁榮。”
為此,昇騰打出了一套“組合拳”,主要解決開發者“一卡難求”和“遷移成本高”的痛點。
為了降低門檻,昇騰決定向社區提供全年4000張卡的免費算力資源,其中超過一半是最新的昇騰950,開發環境拉起時間從90分鐘縮短至5分鐘以內。同時,無論是個人開發者還是高校學生,都可以在AtomGit社區上免費使用算力,實現“邊開發、邊驗證、邊落地”。
除了算力,昇騰還設立了2000萬元的專項激勵基金,專門面向個人開發者、高校學生等群體。 無論是算子開發、框架適配、模型遷移還是創新應用,只要對生態有貢獻,就有機會獲得激勵。
華為昇騰專家直言:“如果2000萬花完了我再追加,今年一定要把這個錢做下去。”這種“撒錢”式的投入,本質上是對開發者時間的尊重和對生態繁榮的渴望。
截至目前,開源4個多月后,昇騰CANN在AtomGit上的倉庫從20多個增長到40多個,加上外部伙伴的項目,總計達70多個。
更可喜的是,出現了“自己的CANN”——一些企業和高校基于開源版本,開發了滿足自身特定需求的分支。例如,中石油、南方電網等傳統行業客戶,自發基于昇騰開源軟件進行開發適配。
華為昇騰專家對此樂見其成:“開源取得了我們不知道的、從來沒有想過的效果。”
![]()
另外,面對海量的模型適配、算子開發需求,人力終有窮盡。
為此,昇騰推出了全套的Agent工具鏈。例如,一個集成了華為經驗的“模型工程全流程Agent”,能在1分鐘內找到模型,1小時內驗證,1天內完成在昇騰上的部署。團隊甚至將優化、調優的“Skills”開源,讓其他Agent也能調用,目標是將AI開發從“專家手藝”變成“全民工程”。
事實上,昇騰生態的崛起,其意義遠超過一個商業產品的成功。它回答了一個關鍵問題:在AI算力底座領域,中國除了追趕,能否走出一條不同的、可持續的道路?
顯然,在DeepSeek V4發布的當下,AI算力競爭已進入深水區。昇騰生態的全面革新,不僅僅是一次產品的升級,更是一次生態哲學的勝利。
它證明了中國AI算力底座不需要做誰的“影子”,通過“底層做厚、體驗做輕”,通過“全面開源、全面兼容”,完全有能力構建起一個繁榮、自主、開放的AI世界。
回到文章開頭的那個問題,昇騰和DeepSeek聯手,真的掀了英偉達的桌子嗎?
從某種意義上說,他們已經把桌子掀翻了,他們打破了“除了英偉達別無選擇”的壟斷局面,為中國AI產業構建了一個安全、可靠、高性能的新選擇。
當然,這場比拼還遠未結束,英偉達依然強大,生態的建設也不是一朝一夕之功。
但至少在2026年的今天,我們看到了一個充滿希望的未來。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.