![]()
■V4發(fā)布的前后一周,國產(chǎn)AI集中爆發(fā)
■中國AI構(gòu)建起體系化的競爭模式
■更具韌性的產(chǎn)業(yè)格局有了雛形
作者|謝涵
編輯|陳秋
另鏡ID:DMS-012
國產(chǎn)AI正步入一個(gè)關(guān)鍵的結(jié)構(gòu)性轉(zhuǎn)折期。
4月24日,萬眾期待的DeepSeek V4終于正式發(fā)布,憑三項(xiàng)數(shù)據(jù),迅速讓科技圈沸騰起來——
1.6萬億參數(shù)、100萬Token上下文、價(jià)格僅為0.025元/百萬Tokens,定價(jià)為美國同類競品的1/10。
發(fā)布僅數(shù)小時(shí),V4便沖上了海外討論熱榜。而就在2天前,美國眾議院在4月22日通過了MATCH法案,進(jìn)一步加強(qiáng)對關(guān)鍵半導(dǎo)體制造設(shè)備的出口管制。
出口禁令覆蓋深紫外光刻等關(guān)鍵設(shè)備,對中芯國際、長江存儲、華為等企業(yè)施加實(shí)體清單式封鎖,設(shè)備維護(hù)和技術(shù)支持一并切斷。
值得玩味的是,法案推進(jìn)的同時(shí),英偉達(dá)迅速推出了針對V4的Blackwell平臺適配方案。美國芯片巨頭反在積極維護(hù)中國客戶。
V4發(fā)布的前后一周,國產(chǎn)AI集中爆發(fā),比如kimi K2.6和美團(tuán)LongCat-2.0-Preview,而且后者的推理和訓(xùn)練全程基于國產(chǎn)算力。新模型、新技術(shù)能力接連亮相,一條清晰的戰(zhàn)略主線正浮出水面——
中國AI正在以萬億參數(shù)模型群為先導(dǎo),構(gòu)建起體系化的競爭模式。這種多維度、高密度的創(chuàng)新,體現(xiàn)為四個(gè)趨勢。
![]()
![]()
萬億參數(shù)模型涌現(xiàn)
DeepSeek V4發(fā)布后,海外媒體紛紛報(bào)道跟進(jìn),其中的一個(gè)核心觀點(diǎn)是,“中國科技企業(yè)正在迅速縮小與美國巨頭的差距”。
英國路透社指出,DeepSeek-V4在世界知識測評中大幅領(lǐng)先于其他開源模型,僅次于谷歌的頂尖閉源模型,反映出中國企業(yè)在AI領(lǐng)域突飛猛進(jìn)的技術(shù)實(shí)力。
半島電視臺評論稱,AI已成為中美“科技競賽”的關(guān)鍵領(lǐng)域,盡管美國依然在開發(fā)最先進(jìn)模型方面略占優(yōu)勢,中國科技公司正在努力縮小與美國AI巨頭之間的技術(shù)差距。
外媒的關(guān)注,反應(yīng)出國際社會正在重新審視中國AI的創(chuàng)新能力。長期以來,萬億參數(shù)模型被視為只有擁有英偉達(dá)頂級GPU集群的美國巨頭才能觸及的高地,現(xiàn)在,固有格局正被中國企業(yè)體系化的突破所改寫。
![]()
DeepSeek V4,則是一個(gè)縮影。
就在V4發(fā)布的同一天,美團(tuán)LongCat-2.0-Preview也正式開放測試,且參數(shù)規(guī)模同樣突破萬億,支持百萬級的超長上下文,處理量級與新發(fā)布的GPT-5.5齊平。這意味著,“萬億俱樂部”出現(xiàn)了多個(gè)中國面孔,更在核心推理能力上實(shí)現(xiàn)與世界頂尖水平并跑。
再往前,4月21日,月之暗面發(fā)布了編程模型Kimi K2.6。總參數(shù)量達(dá)1萬億,支持256K Token上下文窗口及原生多模態(tài)輸入。
這波萬億級爆發(fā)的背后有個(gè)新趨勢,中國AI企業(yè)進(jìn)入了技術(shù)交叉驗(yàn)證、協(xié)同向上的周期。例如,V4采用了Muon優(yōu)化器,正是月之暗面去年驗(yàn)證開源的技術(shù)。
模型廠商通過技術(shù)開源和路徑驗(yàn)證,形成一個(gè)高效的創(chuàng)新共同體,推高了國產(chǎn)AI的智力上限。
![]()
算力自主提速
國產(chǎn)芯片通過首場大考
DeepSeek V4之所以讓業(yè)界震動,在于它完成了一次極具挑戰(zhàn)的底層技術(shù)棧調(diào)整——從訓(xùn)練到推理,V4不再只依賴海外算力,開始與華為昇騰等國產(chǎn)芯片深度適配。這一跨越,被《華爾街日報(bào)》評價(jià)為中國芯片行業(yè)的“關(guān)鍵里程碑”。
要知道,隨著美國出口管制持續(xù)收緊,英偉達(dá)在中國高端芯片市場份額已從95%降至0%。DeepSeek進(jìn)行了一場艱難的技術(shù)路線重構(gòu),V4團(tuán)隊(duì)需要在算力受限下,用新的軟件框架重寫代碼、實(shí)現(xiàn)性能突破。
但這一轉(zhuǎn)向,是出于長遠(yuǎn)的考量。若長期依賴英偉達(dá)的CUDA生態(tài),國產(chǎn)大模型始終面臨供應(yīng)鏈不確定的風(fēng)險(xiǎn),且只能在性能受限的版本上做減法。
V4和美團(tuán)LongCat的轉(zhuǎn)向,標(biāo)志著國產(chǎn)芯片的角色不再只是“替代方案”。
![]()
然而,DeepSeek V4的突破證明了國產(chǎn)芯片可以支撐頭部模型的“關(guān)鍵環(huán)節(jié)”,那么美團(tuán)LongCat-2.0-Preview的橫空出世,則進(jìn)一步宣告國產(chǎn)算力全具備了支撐萬億參數(shù)模型全流程訓(xùn)練與推理的硬實(shí)力。
可以說,這是一次國產(chǎn)算力工程化能力的系統(tǒng)性檢驗(yàn)。
據(jù)悉,美團(tuán)新一代大模型的訓(xùn)練推理,全程依托一個(gè)規(guī)模達(dá)5萬至6萬張國產(chǎn)算力卡的超大規(guī)模集群,是目前國產(chǎn)算力完成的規(guī)模最大的訓(xùn)練任務(wù),標(biāo)志著國產(chǎn)自主算力邁出了關(guān)鍵的一步。
LongCat-2.0-Preview的問世,技術(shù)團(tuán)隊(duì)也進(jìn)行了一場適配攻堅(jiān)。
國產(chǎn)芯片顯存容量和帶寬的差異,尚在成長中的國產(chǎn)芯片環(huán)境,訓(xùn)練中可能出現(xiàn)的故障……這些問題,都是不小的工程挑戰(zhàn)。團(tuán)隊(duì)付出更多精力在并行策略、顯存優(yōu)化上,并大規(guī)模重寫核心算子,構(gòu)建可以感知故障、彈性修復(fù)的容錯(cuò)體系。針對國產(chǎn)硬件的特性,團(tuán)隊(duì)還對訓(xùn)練框架和模型結(jié)構(gòu)做了親和設(shè)計(jì),有效提升了計(jì)算性能。
國產(chǎn)大模型+國產(chǎn)芯片的適配潮背后,是國產(chǎn)芯片在市場占有率上的增長。
![]()
IDC報(bào)告顯示,2025年中國AI加速卡總出貨量約400萬張。英偉達(dá)出貨約220萬顆,市場份額降至約55%;而中國本土芯片廠商合計(jì)出貨約165萬張,市場份額已攀升至41%。其中,華為出貨約81.2萬顆,占比20%。
國際投行伯恩斯坦(Bernstein Research)甚至預(yù)測,2026年,華為將占據(jù)中國AI芯片市場50%的份額,而英偉達(dá)的份額將大幅萎縮至8%。
為了確保算力安全,國產(chǎn)大模型企業(yè)也開始深度介入上游的“造芯”環(huán)節(jié)。
美團(tuán)投資了摩爾線程、沐曦股份、紫光展銳等21家頭部半導(dǎo)體/智能硬件和大模型公司,覆蓋GPU、邊緣算力、端側(cè)芯片及半導(dǎo)體新材料等多個(gè)關(guān)鍵賽道。
國產(chǎn)芯片正從保障產(chǎn)業(yè)安全的底線,轉(zhuǎn)向更為主動的競爭動作。
![]()
大模型的終局:解決真實(shí)需求
從產(chǎn)業(yè)鏈看,大模型的終局是應(yīng)用,是解決真實(shí)世界的需求。沒有真實(shí)場景的磨煉,光靠參數(shù)堆砌,也無法形成閉環(huán)。
DeepSeek V4發(fā)布后,市場研究公司Counterpoint首席AI分析師孫偉就指出,DeepSeek在國產(chǎn)芯片上原生運(yùn)行,強(qiáng)化了中國的“AI主權(quán)”。
這不僅體現(xiàn)在產(chǎn)業(yè)韌性,也體現(xiàn)在場景深度。
所謂產(chǎn)業(yè)韌性,是在外部技術(shù)限制的環(huán)境下,DeepSeek、美團(tuán)等眾多國內(nèi)玩家,正通過加強(qiáng)國產(chǎn)芯片、框架與算法的深度協(xié)同,推動大模型產(chǎn)業(yè)鏈的自主進(jìn)程。
而所謂場景深度,則是國產(chǎn)AI的差異化特點(diǎn)。
![]()
4月13日,斯坦福發(fā)布的《AI指數(shù)報(bào)告》顯示,中美模型差距已縮窄至2.7個(gè)百分點(diǎn),但AI對生產(chǎn)力的實(shí)際貢獻(xiàn)卻呈現(xiàn)出截然不同的圖景。
根據(jù)賓夕法尼亞大學(xué)沃頓預(yù)算模型測算,2025年美國生產(chǎn)率增長率為2.7%,但AI對全要素生產(chǎn)率的實(shí)際貢獻(xiàn)僅為0.01個(gè)百分點(diǎn),幾乎接近于零。但在中國,AI展現(xiàn)出不同的顆粒度——
我們擁有全球第一的工業(yè)機(jī)器人安裝量(29.5萬臺,是美國的8.6倍),建成了全球最多的公共AI超算(85臺),職場AI使用率超80%,遠(yuǎn)超全球平均水平。此外,中國還有世界上最豐富的民生需求商業(yè)業(yè)態(tài)。
以美團(tuán)為例,其覆蓋全國2800多個(gè)市縣的即時(shí)配送網(wǎng)絡(luò),應(yīng)對著中國最復(fù)雜的地理環(huán)境。此外,美團(tuán)無人車?yán)塾?jì)已完成550萬單配送任務(wù)、無人機(jī)目前累計(jì)完成商業(yè)訂單超78萬筆,已在國內(nèi)外開通70條航線。
這些高頻、真實(shí)的環(huán)境,可以提供長期連續(xù)的運(yùn)營數(shù)據(jù)和穩(wěn)定性的驗(yàn)證空間。這也是為什么王興強(qiáng)調(diào),美團(tuán)要打造物理世界的AI底座。
![]()
開源生態(tài)
反哺國產(chǎn)芯片突圍
此外,國產(chǎn)AI還擁有蓬勃的開源生態(tài)。
早在V4發(fā)布前,黃仁勛就發(fā)出警告,如果像DeepSeek這樣的突破性成果首先在華為這樣的國產(chǎn)平臺上運(yùn)行,對美國將是“非常糟糕的結(jié)果”。
他的擔(dān)憂,指向的英偉達(dá)CUDA生態(tài)的護(hù)城河。如果國產(chǎn)芯片與國產(chǎn)大模型形成完整的閉環(huán),CUDA生態(tài)的排他性,勢必受到影響。
一方面,以DeepSeek為代表的國產(chǎn)大模型,正在加速國產(chǎn)芯片生態(tài)的成熟。
DeepSeek V4、Kimi K2.6以及美團(tuán)LongCat等萬億級模型的發(fā)布,會帶來廣泛的應(yīng)用需求,驅(qū)動進(jìn)一步的芯片研發(fā)和適配,同時(shí)真實(shí)的場景數(shù)據(jù)推動芯片性能迭代。
![]()
以美團(tuán)LongCat-2.0-Preview為例,國產(chǎn)算力支撐了其萬億參數(shù)級模型的全流程訓(xùn)練和推理,驗(yàn)證了國產(chǎn)芯片在計(jì)算正確性、數(shù)值精度和訓(xùn)練穩(wěn)定性上,足以追平國際水平。團(tuán)隊(duì)在其中沉淀下的工程能力,也在為國產(chǎn)芯片生態(tài)積累經(jīng)驗(yàn)。
另一方面,開源模型正重塑全球智力分布。美國對沖基金Interconnected Capital創(chuàng)始人Kevin Xu曾指出,中國開源開發(fā)者的浪潮是2025年后最重要的技術(shù)事件。他認(rèn)為,“開源是未來的軟實(shí)力”。
本周,主流第三方榜單Arena更新了數(shù)據(jù)。開源榜上前五名,已全部由中國模型占據(jù),前十名除了第六名的Gemma 4 31B,已經(jīng)都是國產(chǎn)模型。
其次,開源也加速了國產(chǎn)算力“軟件棧”的完善。英偉達(dá)強(qiáng)在CUDA,而國產(chǎn)芯片弱在生態(tài)。但隨著DeepSeek V4、LongCat-2.0-Preview等萬億級模型在國產(chǎn)算力上逐漸跑起來,很多實(shí)踐中的適配經(jīng)驗(yàn)也將帶來產(chǎn)業(yè)協(xié)同效應(yīng)。
從萬億參數(shù)模型的接連出現(xiàn),到國產(chǎn)算力的持續(xù)追趕,再到模型與芯片的協(xié)同進(jìn)化,一個(gè)更具韌性的產(chǎn)業(yè)格局有了雛形。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.