![]()
突發(fā)重大利好!
市場望眼欲穿的DeepSeek模型V4的預(yù)覽版本,今天終于正式上線,并同步開源。
DeepSeek-V4擁有百萬字超長上下文,在Agent能力、世界知識和推理性能上,均實現(xiàn)大幅度提升,再一次在開源模型上站到了業(yè)界C位。
這推動自主可控芯片板塊應(yīng)聲大漲,大量資金涌入中芯國際、海光信息、寒武紀(jì)、摩爾線程、華虹公司等個股。
DeepSeek-V4這代版本,讓市場等得太久了。
上一代,DeepSeek-V3,還是2024年12月26日發(fā)布的,離現(xiàn)在已經(jīng)有整整484天了。
也就是1年3個月29天。
要知道,大模型發(fā)展日新月異,競爭異常激烈,很多頂尖模型每2-3個月就更新一個版本。
DeepSeek這次更新,為什么花了這么久呢?
主要有兩個原因:第一是目標(biāo)定的高,第二是芯片國產(chǎn)化的大遷徙。
先說目標(biāo)。
當(dāng)初的V3,是個很精簡的小模型,總參數(shù)只有671B(6710億),預(yù)訓(xùn)練數(shù)據(jù)14.8T token,上下文128k。
我們看這一次發(fā)的V4?Pro(旗艦版),總參數(shù)提升到了1.6T(16000億),是V3的2.38倍;
預(yù)訓(xùn)練數(shù)據(jù)32T~33T token,約V3的2.2倍,上下文1M(100萬)token,約V3的7.8倍。
這就像是一輛經(jīng)濟(jì)型代步車,升級成跑車,還是自研發(fā)動機(jī)的那種。
這可不是簡單的“放大”尺寸,必須是整個底層架構(gòu)都要重新設(shè)計。
它們之間,需要用到的技術(shù)、材料、工藝,完全不是一回事,自然就需要花大量的時間去重新設(shè)計。
再說第二個芯片國產(chǎn)化的遷徙。
當(dāng)下我國的大模型訓(xùn)練,有一個說一個,主力芯片全都是用的英偉達(dá)。
而DeepSeek,是第一個,下決心完全拋棄海外芯片,只用國產(chǎn)貨的企業(yè)。
眾說周知,英偉達(dá)的CUDA生態(tài)經(jīng)過20年的發(fā)展,已經(jīng)相當(dāng)成熟了。
轉(zhuǎn)向用國產(chǎn)芯片,底層代碼又要全部重寫一遍去適配,還要去解決芯片不成熟帶來的各種bug導(dǎo)致的崩潰。
這就相當(dāng)于把一輛汽油車改成電動車,還要保證續(xù)航和速度不變,這工程量是大到難以想象的。
由于國產(chǎn)算力的不足,為了提升模型競爭力,DeepSeek不得不搞出大量的本土化創(chuàng)新。
比如上FP8全鏈路訓(xùn)練,這東西就像國產(chǎn)模型當(dāng)初搞出的MOE專家模型一樣,屬于在算力受限情況下,為提升競爭力而進(jìn)行的創(chuàng)新。
但用海外芯片的,都不需要搞這么復(fù)雜。
于是就相當(dāng)于別人開著成熟的生產(chǎn)線造零件,它非要自己研發(fā)生產(chǎn)線,還要保證零件精度,光調(diào)試代碼、校準(zhǔn)精度,就耗掉了兩個多月。
就這樣,好事多磨,花了比別人多幾倍的時間去更新版本。
不過,好飯不怕晚,如今終于端上來了。
我們看看,這個版本有哪些亮點:
1,百萬字超長上下文。
跟OpenAI GPT?5.4、Google Gemini 3.1 Pro、Anthropic Claude Opus 4.6、通義千問 Qwen 3.5 Plus等大廠處于同一水平。
而遙遙領(lǐng)先于kimi、智譜、minimax等國產(chǎn)創(chuàng)企的模型,后者的長度通常在200k左右。
這個能力在法律文書審核、金融財報分析、科研文獻(xiàn)研讀、多輪智能對話等專業(yè)場景中非常重要。
2,Agent能力領(lǐng)跑國內(nèi)開源。
相較于普通大模型只能被動響應(yīng)指令,DeepSeek-V4具備完整的自主規(guī)劃、工具調(diào)用、多智能體協(xié)同、復(fù)雜任務(wù)拆解閉環(huán)能力。
無需人工過多干預(yù),就能獨立完成代碼全流程開發(fā)、辦公自動化全流程處理、行業(yè)解決方案定制、復(fù)雜數(shù)據(jù)推演等高階任務(wù)。
這意味著,V4真正從“工具型AI”升級為“協(xié)作型AI”,在國內(nèi)開源模型中一騎絕塵。
3,推理與知識性能登頂。
在MMLU、GSM8K、C-Eval等全球權(quán)威AI模型評測基準(zhǔn)中,DeepSeek-V4的通識知識準(zhǔn)確率、數(shù)學(xué)邏輯推理、代碼編寫、中文語義理解能力,均位列國內(nèi)開源模型首位。
核心指標(biāo)媲美國際頂尖閉源模型,且針對中文語境、本土行業(yè)規(guī)則做了深度優(yōu)化,落地實用性遠(yuǎn)超海外通用模型。
DeepSeek-V4終于又一次站回到了行業(yè)C位,實在是可喜可賀!
但更重要的是,DeepSeek-V4全程采用去美化研發(fā)路線,模型訓(xùn)練、推理優(yōu)化、生態(tài)適配全流程,均基于華為昇騰、寒武紀(jì)、海光信息等國產(chǎn)AI芯片完成。
完全不依賴任何海外芯片架構(gòu)、軟件工具與編譯生態(tài),真正實現(xiàn)“中國模型、中國算力、中國生態(tài)”的全鏈路自主可控。
這意味著,國產(chǎn)算力完全有能力支撐世界頂級大模型的全流程運作。
海外芯片,終于可以被國內(nèi)AI產(chǎn)業(yè)拋棄了。
這無疑是給國產(chǎn)自主可控產(chǎn)業(yè)鏈打了一劑強(qiáng)心針。
回到A股,DeepSeek-V4直接利好的,主要是芯片制造和AI芯片兩大環(huán)節(jié)。
相對來說,AI芯片的業(yè)績增速,明顯要強(qiáng)于芯片制造。
對比一季度數(shù)據(jù):
中芯國際:2025年營收+16.49%,凈利潤+36.29%;
華虹公司:2025年營收+20.18%,凈利潤-1.04%.
海光信息:2026年Q1營收+68.06%,凈利潤+35.82%;
寒武紀(jì):2025年營收+453.21%,凈利潤+555.24%;
摩爾線程:2025年Q3營收+181.99%,凈利潤+18.71%;
沐曦股份:2025年營收+121.26%,凈利潤+43.97%;
很明顯,從營收增速來看,AI芯片環(huán)節(jié)的四大龍頭跑的快很多。
凈利潤增速上,除了寒武紀(jì)已經(jīng)進(jìn)入規(guī)模化拐點,迎來業(yè)績大爆發(fā)以外,其它幾家行業(yè)競爭力較弱,利潤增速落后于營收增速。
值得注意的是,今天股價表現(xiàn)最出色的,是華虹公司和海光信息。
主要是美股傳導(dǎo)效應(yīng)的影響。
昨晚,全球模擬芯片巨頭德州儀器,發(fā)布了超預(yù)期的一季報和第二季度指引,隔夜股價大漲19.43%,創(chuàng)2000年10月以來最大單日漲幅。
德州儀器是全球模擬芯片龍頭,市占率約19%-20%,過去幾年被中國企業(yè)發(fā)起的價格戰(zhàn)打得節(jié)節(jié)敗退,股價自2021年之后都沒有漲過。
因此,市場對德州儀器的預(yù)期是很低的。
但最新一季度財報,公司營收同比增長19%,凈利潤同比增長31%,大幅超出市場預(yù)期。
且受益于芯片漲價潮,公司今年一季度也開始提價了,帶來利潤率的上揚,凈利潤率從28.28%提升到32.02%。
華虹公司主營成熟芯片和模擬芯片代工,是德州儀器的最直接傳導(dǎo)標(biāo)的。
另外,昨晚英特爾也發(fā)布了一季報,盤后股價大漲近20%,創(chuàng)下近年單日最大漲幅。
財報顯示,英特爾一季度營收同比增長7%,剔除股權(quán)薪酬、重組費用等非經(jīng)常性損益后,非GAAP凈利潤15億美元,同比大增156%。
英特爾這番業(yè)績大爆發(fā),一方面跟新CEO陳立武的鐵血改革有很大關(guān)系,他通過大規(guī)模裁員、剝離非核心資產(chǎn),讓公司得以止血。
另一方面,也跟AI行業(yè)從“訓(xùn)練”轉(zhuǎn)向“推理”的風(fēng)口變化有關(guān)。
由于AI 推理、智能體(Agent)的爆發(fā),相關(guān)需求更吃CPU,讓英特爾的服務(wù)器芯片(至強(qiáng)CPU)營收大幅增長了40%,并提價10–15%。
海光信息主營通用CPU和GPU芯片,是英特爾的最直接傳導(dǎo)標(biāo)的。
我們來看看近幾年的中國AI芯片行業(yè)變化。
根據(jù)伯恩斯坦(Bernstein)的報告,2023年中國AI芯片市場規(guī)模約780億元,英偉達(dá)份額約95%,國產(chǎn)芯片只有可憐的5%。
而到了去年,2025年,這一市場的規(guī)模大幅增長至1530–1780億元。
AI芯片總出貨約401.6萬張,其中英偉達(dá)220萬張,份額下降至55%。
國產(chǎn)出貨約165萬張,提升至45%。
其中——
華為昇騰:81.2萬張,占國產(chǎn)49%,斷層第一;
阿里平頭哥:26.5萬張,占國產(chǎn)16%,排名第二;
百度昆侖芯:11.6萬張,占國產(chǎn)7%,排名第三;
寒武紀(jì):11.6萬張,占國產(chǎn)7%,排名第四;
海光信息(DCU):約8.3萬張,占國產(chǎn)5%,排名第五;
摩爾、沐曦、天數(shù)、壁仞:合計約25萬張,占國產(chǎn)15%,平均每家4%左右。
這里面,阿里平頭哥和百度昆侖芯,都是自用為主的專用芯片,類似谷歌的路線。
華為昇騰和寒武紀(jì),在獨立第三方的市場中,相對領(lǐng)先,類似于英偉達(dá)和AMD的地位。
海光信息,更偏重CPU業(yè)務(wù),類似于英特爾。
摩爾、沐曦、天數(shù)、壁仞這些創(chuàng)企,當(dāng)下市場份額較小,競爭力較弱,未來的不確定性還是比較大的。
我們重點分析一下華為和寒武紀(jì)。
華為毫無疑問是國產(chǎn)AI芯片的實力最強(qiáng)者,占據(jù)了行業(yè)一半的份額,且研發(fā)實力領(lǐng)先,自研達(dá)芬奇架構(gòu)、擁有CANN軟件棧(對標(biāo)CUDA)。
一來是錢多、投入多,二來是產(chǎn)業(yè)生態(tài)搭建的早,目前已擁有開發(fā)者80萬,遠(yuǎn)超過寒武紀(jì)的10萬。
三來是在利潤率最高的政企市場上,擁有壟斷地位,市場份額在60%-70%左右。
四是產(chǎn)能穩(wěn)定,由于在自主制造、先進(jìn)制程研發(fā)中投入了大量資源,像中芯國際的N+2/N+3產(chǎn)線,會優(yōu)先服務(wù)、配套華為的需求。
這讓華為的芯片產(chǎn)能得以穩(wěn)定增長,2024年產(chǎn)量50.7萬張,2025年80.5萬張。
今年預(yù)計產(chǎn)能不會大幅增長,維持在80-85萬張左右,但主力產(chǎn)品將從910C切換向950PR(推理)、950DT(訓(xùn)練),這兩款芯片配套了自研的HBM存儲芯片,性能大幅提升。
明年,2027年,預(yù)計隨著新一代國產(chǎn)先進(jìn)光刻機(jī)的量產(chǎn),中芯國際的先進(jìn)節(jié)點產(chǎn)能將大幅提升,推動華為AI芯片出貨量提升至110-120萬張。
說白了,華為昇騰的核心競爭力,靠的是 “全棧生態(tài) + 政企壟斷 + 產(chǎn)能穩(wěn)定”,強(qiáng)者通吃效應(yīng)下,未來市場份額預(yù)計提升至80%。
華為昇騰生態(tài)標(biāo)的:
拓維信息(政企運營)、軟通動力(軟件外包)、神州數(shù)碼(分銷)、中芯國際(代工)、興森科技(PCB配套)
寒武紀(jì),即沒有華為的強(qiáng)大生態(tài),也沒有阿里、百度的大廠資源,能夠突圍而出。
肯定是有兩把刷子的。
寒武紀(jì)最大的競爭力是什么呢?
差異化的技術(shù)路線。
根據(jù)業(yè)內(nèi)報告,寒武紀(jì)的技術(shù)有以下特點:
1,自研MLU架構(gòu)(思元系列)。
國內(nèi)唯一全棧指令集 + 微架構(gòu)自主,思元590支持50B參數(shù)模型推理,能效比是主流GPU的2倍。
2,Chiplet技術(shù)(思元370)。
雙芯粒封裝,LPDDR5內(nèi)存帶寬3倍于上代,訪存能效達(dá)GDDR6的1.5倍,成本比華為低30%+。
3,稀疏計算硬件加速。
跳過零值運算,推理能效提升40%,適配DeepSeek等稀疏化大模型,互聯(lián)網(wǎng)推理場景優(yōu)勢明顯。
4,MagicMind推理引擎。
基于MLIR圖編譯,訓(xùn)推一體、開發(fā)成本低,適配主流框架,推理性能接近 CUDA。
這里面,最核心的就是基于互聯(lián)網(wǎng)創(chuàng)企的需求進(jìn)行優(yōu)化,推出了稀疏計算硬件加速等獨特技術(shù)。
而且,不做云、服務(wù)器、終端,不與阿里 、騰訊、字節(jié)等大廠業(yè)務(wù)競爭,自然更獲互聯(lián)網(wǎng)巨頭信任。
另外就是價格優(yōu)勢,思元590價格為昇騰910B的60%,性價比還是可以的。
從市占率來看,寒武紀(jì)在2025年國內(nèi)AI芯片市場的份額約5%–7%,云端推理12%–15%,互聯(lián)網(wǎng)推理20%+。
在互聯(lián)網(wǎng)行業(yè)的市場份額,與華為相比,明顯差距最小。
據(jù)業(yè)內(nèi)傳言,2025年字節(jié)跳動采購了20多萬張訂單,用于推理集群,是其最大客戶;
由于針對長文本推理做了專項優(yōu)化,性價比出色,DeepSeek、MiniMax等互聯(lián)網(wǎng)創(chuàng)企也會選擇寒武紀(jì)的芯片。
過去十幾年,國產(chǎn)AI芯片產(chǎn)業(yè)崛起,最大的阻力從來不是單顆芯片的性能,而是軟件生態(tài)的壟斷。
英偉達(dá)CUDA生態(tài)歷經(jīng)近二十年深耕,和全球開發(fā)者進(jìn)行了深度綁定,成為其最深的護(hù)城河,也是國產(chǎn)芯片最難突破的壁壘。
現(xiàn)在,隨著DeepSeek V4模型全面適配國產(chǎn)AI芯片,并成功站上來源大模型的C位,以后肯定會有越來越多的國產(chǎn)大模型追隨著走上這條路。
這意味著英偉達(dá)芯片生態(tài)的霸權(quán),正在一步步被瓦解。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.