網易首頁 > 網易號 > 正文申請入駐

華為宣布：全面支持DeepSeek V4

2026-04-26 12:35:40　來源: DeepAuto車探

安徽舉報

分享至

4月24日，DeepSeek正式發布并開源DeepSeek V4-Pro與DeepSeek V4-Flash兩款模型，將上下文處理長度從128K一舉擴展至1M，實現近10倍容量躍升。

華為隨即第一時間宣布昇騰超節點全系列產品全面支持該系列模型，通過芯模技術緊密協同，實現模型發布與算力適配的同步推進，為長上下文大模型的工程化落地注入強勁動力。

1、DeepSeek V4系列此次升級有多顛覆性？

DeepSeek首次引入KV Cache滑窗與壓縮算法，結合獨創混合注意力架構，使V4-Pro在1M上下文場景下單token推理FLOPs僅為V3.2的27%，KV Cache占用降至10%，大幅降低注意計算與訪存開銷。

同時通過架構創新強化Agent與Coding場景支持，V4-Pro在Agentic Coding評測中已達到開源模型最佳水平，交付質量甚至優于部分閉源競品。

2、在推理性能層面

昇騰950超節點能實現在8K輸入場景下，DeepSeek V4-Pro實現TPOT約20ms、單卡Decode吞吐4700TPS；V4-Flash更勝一籌，TPOT約10ms、單卡Decode吞吐1600TPS。

這些成績源于三大架構升級：

①原生精度加速支持FP8、MXFP8等格式，內存占用降低50%+；

②稀疏訪存優化強化硬件級帶寬能力；

③Vector與Cube共享Memory設計減少片上數據搬運，有效降低端到端時延。

昇騰A3超節點系列進一步夯實規模化部署能力，Atlas 900 A3液冷及Atlas 800 A3風冷超節點采用平等架構與全局內存統一編址，點對點互聯帶寬達784GB/s，支持32至384卡多規格配置。

在實際部署中，基于昇騰A3 64卡超節點結合大EP模式，V4-Flash在8K/1K輸入輸出場景下通過vLLM引擎可實現單卡Decode吞吐2000+TPS，充分滿足互聯網、運營商、金融等行業高并發需求。

華為云同步發力，宣布首發適配DeepSeek V4，其MaaS平臺已為開發者提供免部署、一鍵調用V4-Flash API的Tokens服務。

通過系統層、算子層和集群層的協同優化，從調度效率、計算效率和數據流轉效率三個維度保障新模型快速適配與高性能落地，金山辦公、360等企業已率先通過華為云接入新模型。

3、開發生態方面

昇騰CANN推出PyPTO編程范式，使相關算子開發周期縮短至天級，配套TileLang-Ascend在TileAI社區開源實現，加速性能優化與功能迭代。

整體來看，DeepSeek V4在模型側通過1M上下文、結構壓縮與Agent能力提升，顯著擴展應用邊界；

華為昇騰則在算力側以950與A3超節點為核心，通過10ms/20ms低時延、1600TPS/4700TPS及2000+TPS高吞吐、784GB/s大規模互聯等指標實現工程化承接。

二者同步推進，不僅讓長上下文、高性能推理、規模化部署的組合路徑更加清晰，更反映出開源模型與國產算力體系在協同演進中的加速態勢，為AI產業“去英偉達化”提供堅實技術支撐。

聲明：個人原創，僅供參考

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Moltbot作者被Claude刁難后：MiniMax M2.1是最優秀的開源模型

量子位 2026-01-29 13:17:17
13 跟貼 13
拒絕盲目猜token，阿里x浙大將投機解碼帶入彈性預算時代

機器之心Pro 2026-05-13 13:39:40
0 跟貼 0

CVPR 2026 | 從視覺Token內在變化量出發，實現VLM無損加速1.87倍

機器之心Pro 2026-03-16 11:56:33
0 跟貼 0

剛剛，微信聊天記錄能喂給AI了！我讓它爬樓、砍價、整理信息

智東西 2026-05-13 15:48:56
0 跟貼 0
這屆網民，唯恐失去最后的“數字喘息空間”

經濟觀察報 2026-05-13 15:26:33
0 跟貼 0

沈逸：紙面上的東西別當真，美企業照樣在用華為

特廚魏味 2026-05-10 02:18:33
71 跟貼 71

90后“稚暉君”，任上緯新材董事長！他是原華為天才少年

每日經濟新聞 2025-11-26 14:49:35
1 跟貼 1
黃仁勛：我是中國人，只不過是在美國長大而已！

臺海風云 2026-05-10 13:16:50
155 跟貼 155

15%全量Attention！「RTPurbo」阿里Qwen3長文本推理5倍壓縮方案

機器之心Pro 2025-12-23 12:52:34
0 跟貼 0
未來已至，你準備好了嗎

諾克科普 2026-05-12 11:34:39
1 跟貼 1
智界V9官宣搭載華為悅彰非凡系列音響

齊魯壹點 2026-05-13 17:24:32
0 跟貼 0
天下苦CUDA久矣，又一國產方案上桌了

量子位 2026-01-30 21:59:52
6 跟貼 6
身在異國他鄉看到華為的產品，是不是會更自豪？

唇眷 2026-05-10 04:07:04
0 跟貼 0
華為硫化物固態電池來了,充電5分鐘續航3000公里,還有兆瓦充電樁

知嘹汽車 2026-05-12 17:33:51
0 跟貼 0
史上最香的Pura？華為Pura 90 Pro越用越有味

雷科技 2026-05-08 20:27:00
15 跟貼 15
用了半個月華為Pura 90 Pro Max，它似乎比我想象的好用。。。【X.PIN】

差評XPIN 2026-05-13 21:32:13
0 跟貼 0
真正有遠見清醒發言，美女這番話透徹，愿所有國人都有這份認識

愛旅游的小g 2026-05-13 05:09:09
0 跟貼 0
奕境X9破局邏輯：央企華為深度綁定，重塑華系汽車技術標桿

汽車很聽話 2026-05-13 22:39:24
0 跟貼 0
華為Mate 80系列銷量逼近600萬大關史上最火Mate實至名歸

快科技 2026-05-12 16:58:32
0 跟貼 0
安全基因刻進骨子里！華為乾崑車載光給你多重守護

二師兄玩車 2026-05-11 21:15:03
0 跟貼 0
華為手機殺瘋了！電池容量沖破天花板

極果酷玩 2026-05-12 04:18:14
0 跟貼 0
華為：“內推實習”“實習推薦信”“遠程實習”“實習報名直播”等均為虛假信息

界面新聞 2026-05-11 17:52:59
0 跟貼 0
華為乾崑新一代車載光黑科技，安全+好玩直接拉滿！

快上車Go 2026-05-13 12:22:21
0 跟貼 0
從“亮就行”到“玩出花”，華為乾崑車載光技術到底有多牛

嘻哈車 2026-05-12 09:42:59
3 跟貼 3
全國高速 L3 普及提速，華為乾崑打造智能汽車技術新底座

汽車觀察AUTO 2026-05-13 16:52:35
3 跟貼 3
眼睛看光毯，抬頭見預警！華為乾崑車載光，讓安全看得見

科技Sex 2026-05-13 20:18:31
3 跟貼 3
深圳最狠的地方：每隔十年，就親手“殺死”自己一次

飯統戴老板 2026-01-09 17:54:56
0 跟貼 0
博主曝華為招人偏愛“苦大仇深來自農村”，因為這種人沒躺平的資本

風向觀察 2026-05-13 21:17:39
0 跟貼 0
36年卷積猜想被解決，華人唯一作者，AI或受益

機器之心Pro 2025-11-26 14:30:39
0 跟貼 0
燒烤店將排煙管對隔壁直吹鄰居提議自費幫其改造遭拒店主：他說不想讓我占地

荔枝新聞 2026-05-13 04:35:09
462 跟貼 462
俄軍："世界上最強大導彈"試射成功射程超35000公里

紅星新聞 2026-05-13 13:21:19
34057 跟貼 34057
2026 AI最佳場景滲透案例重磅揭曉

36氪 2026-05-13 19:23:26
0 跟貼 0
黃仁勛：請從容接受社會的毒打韌性只能在磨練中擁有

每日經濟新聞 2026-01-08 13:50:38
0 跟貼 0
華境S：14.98萬起，首搭艙內激光雷達，支持華為高階智駕

界面新聞 2026-05-11 15:35:03
0 跟貼 0
ChatGPT、豆包集體翻車：AI沒有價值觀，只有「求生欲」

雷科技 2026-05-11 21:18:29
406 跟貼 406
華為AI眼鏡上手！朋友都說帥爆了，都怪我顏值太高

雷科技 2026-04-20 23:25:15
0 跟貼 0
阿維塔遙控車輛測試，搭載華為鴻蒙車機，中國制造遙遙領先

樂山愛生活 2026-05-11 08:50:38
0 跟貼 0
這臺車到底能多“不務正業”？華境S是真香還是“暈”香

嘻哈車 2026-05-12 10:54:31
1 跟貼 1
國外技術就是強悍，瑞士自動迫擊炮系統，中國目前很難達到

松離搞笑家 2026-05-12 16:30:44
3 跟貼 3
別再把長文切碎了，HiLight讓AI直接在原文里劃重點

機器之心Pro 2026-05-11 10:39:41
0 跟貼 0

汽車要聞

手機 / 數碼

房產 / 家居

華為宣布：全面支持DeepSeek V4

騰訊一季度營收1964.6億元 同比增9%

女子閃婚獲千萬房產99%份額閃離后起訴分割 法院判了

女子閃婚獲千萬房產99%份額閃離后起訴分割 法院判了

14年半，74萬，何冰嬌沒選那條更安穩的路

白鹿掉20萬粉，網友為李晨鳴不平

美國總統特朗普抵達北京

C級純電轎跑 吉利銀河"TT"申報圖來了

態度原創

小米手環10 Pro陶瓷版亮相，搭配柔軟貼合氟橡膠表帶

乾隆 “翻車” 名畫刷屏！

用蘇繡的方式，打開江西婺源

1980年中考：6加6除6，等于多少？

沙特被指3月曾對伊朗發動多次“報復性”空襲

騰訊一季度營收1964.6億元同比增9%

女子閃婚獲千萬房產99%份額閃離后起訴分割法院判了

女子閃婚獲千萬房產99%份額閃離后起訴分割法院判了

C級純電轎跑吉利銀河"TT"申報圖來了