DeepSeek-V4上線近十日,外界對(duì)這款頻頻“跳票”的模型評(píng)價(jià)逐漸清晰:V4是一款性價(jià)比突出、補(bǔ)齊關(guān)鍵能力的務(wù)實(shí)產(chǎn)品,但并未重現(xiàn)當(dāng)年R1的炸場(chǎng)表現(xiàn)。
其中,百萬(wàn)上下文、開源開放與低定價(jià)構(gòu)成其核心亮點(diǎn),上下文有效性、響應(yīng)時(shí)延、穩(wěn)定性則仍有明顯提升空間。置身于全球AI賽道,DeepSeek模型排名回落、迭代周期明顯拉長(zhǎng),疊加外部融資啟動(dòng)等多重信號(hào),曾經(jīng)的大模型創(chuàng)新“領(lǐng)跑者”儼然已退轉(zhuǎn)到“追趕者”位置。
業(yè)內(nèi)認(rèn)為,對(duì)于DeepSeek這個(gè)“技術(shù)理想主義者”而言,這一輪“增速放緩”并非單純的算法或產(chǎn)品問(wèn)題,而是算力路線選擇、工程適配節(jié)奏以及商業(yè)化壓力多重作用的結(jié)果。
![]()
上線十日口碑畫像:性價(jià)比在線,體驗(yàn)仍有短板
自4月24日上線以來(lái),DeepSeek-V4市場(chǎng)評(píng)價(jià)幾經(jīng)反轉(zhuǎn),頗有些“冰火兩重天”的意味。
從多方實(shí)測(cè)結(jié)果來(lái)看,V4在長(zhǎng)文本與代碼兩大核心方向,確實(shí)交出了可落地的答卷。模型支持百萬(wàn)級(jí)上下文窗口,在文檔處理、長(zhǎng)篇代碼庫(kù)解析、報(bào)告總結(jié)等場(chǎng)景中具備明顯優(yōu)勢(shì),官方將這一能力開放普惠,有效降低了中小開發(fā)者與企業(yè)使用長(zhǎng)上下文的門檻。
在代碼生成方面,V4對(duì)常規(guī)前端實(shí)現(xiàn)、算法腳本、簡(jiǎn)單工具類程序的完成度較高。如2048小游戲、樹形生長(zhǎng)動(dòng)畫、康威生命游戲等任務(wù),均可穩(wěn)定輸出可直接運(yùn)行的代碼,在有明確規(guī)劃與任務(wù)拆解的條件下,足以勝任較為復(fù)雜的Web應(yīng)用實(shí)現(xiàn)。
更重要的是,DeepSeek保持了一貫的低成本優(yōu)勢(shì),實(shí)測(cè)多任務(wù)連續(xù)調(diào)用成本顯著低于頭部閉源模型,輕量化版本進(jìn)一步降低了使用門檻,對(duì)預(yù)算敏感的團(tuán)隊(duì)與批量推理場(chǎng)景非常友好。加之模型同步開源,支持私有化部署與二次微調(diào),在產(chǎn)業(yè)落地層面具備很強(qiáng)的現(xiàn)實(shí)價(jià)值。
與此同時(shí),V4的體驗(yàn)短板也同樣突出。在百萬(wàn)字級(jí)別的長(zhǎng)文本“大海撈針”測(cè)試中,模型對(duì)中間區(qū)域信息的召回率明顯下降,容易出現(xiàn)計(jì)數(shù)錯(cuò)誤、位置誤判、關(guān)鍵信息遺漏等問(wèn)題,真實(shí)有效上下文與理論上限存在差距,長(zhǎng)距離“失憶”現(xiàn)象依然存在。
此外,該模型對(duì)復(fù)雜工程化任務(wù)的響應(yīng)速度偏慢,高難度前端實(shí)現(xiàn)耗時(shí)較長(zhǎng),在實(shí)時(shí)性要求高的場(chǎng)景中體驗(yàn)受限。模型整體穩(wěn)定性與一致性也仍有提升空間,如簡(jiǎn)單任務(wù)偶發(fā)邏輯錯(cuò)誤,復(fù)雜需求多次迭代修復(fù)后仍難以完全達(dá)標(biāo),與全球頂尖閉源模型存在明顯差距。
整體而言,V4無(wú)疑是一款目標(biāo)清晰、取舍明確的產(chǎn)品:性價(jià)比與普惠能力極為突出,性能體驗(yàn)則遠(yuǎn)未觸及天花板。這種定位收獲了相對(duì)穩(wěn)定的市場(chǎng)評(píng)價(jià),但也讓DeepSeek失去了曾經(jīng)的先鋒色彩。
從領(lǐng)跑者到追趕者,DeepSeek腳步放緩多重承壓
過(guò)去一年多時(shí)間里,曾經(jīng)以快速迭代、高效研發(fā)、低成本跑出驚人成果的DeepSeek,明顯放緩了迭代節(jié)奏。這在全球AI大模型狂飆猛進(jìn)中顯得分外扎眼。
自去年初R1模型橫空出世,DeepSeek貌似一直困在遲到的路上:年中的R2模型被爆因芯片問(wèn)題一再延期,V4旗艦?zāi)P透侨毕衲甏汗?jié)檔,跳票近半年時(shí)間。而在此期間,OpenAI和Anthropic在海外迅速進(jìn)入月更節(jié)奏,國(guó)產(chǎn)大模型智譜、Kimi也開始加速反超。
據(jù)業(yè)內(nèi)統(tǒng)計(jì),在V4模型遲到5個(gè)多月以來(lái),OpenAI的GPT-5歷經(jīng)四次迭代到了5.4版本,Anthropic的Claude 4.5系列迭代到4.7版本,谷歌的Gemini 3 Pro已更新至3.1版本。
這種迭代速率反差直接呈現(xiàn)在性能榜單上。在公開基準(zhǔn)測(cè)試與社區(qū)盲測(cè)中,DeepSeek系列模型的綜合排名由第一梯隊(duì)跌落到中游區(qū)間,代碼、推理、Agent能力等核心指標(biāo)不再具備絕對(duì)優(yōu)勢(shì),從行業(yè)“領(lǐng)跑者”逐步轉(zhuǎn)變?yōu)椤白汾s者”。
顯然,姍姍來(lái)遲的V4模型,并未一舉扭轉(zhuǎn)頹勢(shì)。近期,深度求索打破此前堅(jiān)持不融資的表態(tài),啟動(dòng)了外部募資。業(yè)內(nèi)認(rèn)為,這一變化背后是大模型研發(fā)持續(xù)升級(jí)的算力投入、人才成本與工程化開支,高強(qiáng)度的“燒錢”模式下,公司自有資金已難以支撐長(zhǎng)期軍備競(jìng)賽。
從行業(yè)視角看,在這場(chǎng)全球化AI競(jìng)速中,DeepSeek所經(jīng)歷的并非個(gè)例,而是當(dāng)前大模型行業(yè)從技術(shù)創(chuàng)新轉(zhuǎn)向規(guī)模化競(jìng)爭(zhēng)的普遍挑戰(zhàn)。但對(duì)DeepSeek而言,這些壓力被進(jìn)一步放大,核心原因是算力路線選擇帶來(lái)的持續(xù)性約束。
有行業(yè)媒體分析,在國(guó)內(nèi)廠商普遍采用更靈活的算力組合策略以保證迭代速度時(shí),DeepSeek深度綁定昇騰,將大量資源投入框架遷移、算子補(bǔ)齊、分布式穩(wěn)定性優(yōu)化等工程工作,這不可避免地拉長(zhǎng)了訓(xùn)練與驗(yàn)證周期,導(dǎo)致模型發(fā)布節(jié)奏被動(dòng)調(diào)整,間接加劇了公司內(nèi)外部壓力。
算力底座掣肘,技術(shù)路線選擇決定長(zhǎng)期走向
大模型迭代的本質(zhì)是數(shù)據(jù)、算法、算力三者的高效共振。在算法與數(shù)據(jù)差距逐步收窄的當(dāng)下,算力的穩(wěn)定性、效率、生態(tài)成熟度,直接決定研發(fā)周期、試錯(cuò)次數(shù)與上線節(jié)奏。
2025年以來(lái),DeepSeek全面轉(zhuǎn)向國(guó)產(chǎn)算力平臺(tái),并與華為昇騰深度綁定。隨后,R2模型因昇騰適配問(wèn)題直接夭折,研發(fā)周期也開始逐漸拉長(zhǎng)。而從公開信息與技術(shù)文檔可以看到,此次DeepSeek-V4并非在昇騰平臺(tái)上完成訓(xùn)練,雙方或僅實(shí)現(xiàn)推理側(cè)適配。
根據(jù)專業(yè)人士判斷,在DeepSeek模型研發(fā)迭代過(guò)程中,昇騰計(jì)算平臺(tái)仍存在三大短板:
第一,訓(xùn)練穩(wěn)定性與效率不足。早期昇騰910C在大規(guī)模分布式訓(xùn)練中故障率偏高,互聯(lián)帶寬與通信延遲相較成熟方案存在差距,大規(guī)模MoE模型訓(xùn)練效率大打折扣。即便升級(jí)到950系列,集群調(diào)度、通信優(yōu)化、異常恢復(fù)等工程化能力也仍需完善,難以支撐高頻次、高強(qiáng)度的模型試錯(cuò)。
第二,軟件生態(tài)遷移成本極高。DeepSeek此前長(zhǎng)期基于CUDA生態(tài)開發(fā),轉(zhuǎn)向昇騰CANN框架后,大量算子、優(yōu)化邏輯、訓(xùn)練腳本需要重寫,調(diào)試周期拉長(zhǎng),問(wèn)題定位難度提升。工程團(tuán)隊(duì)被迫將大量精力投入生態(tài)適配,而非算法創(chuàng)新與模型迭代,間接拖慢了整體進(jìn)度。
第三,硬件代際與供給節(jié)奏錯(cuò)配。模型研發(fā)有明確的時(shí)間窗口,但昇騰加速卡此前經(jīng)歷了從NPU到GPGPU的路線糾偏,芯片量產(chǎn)節(jié)奏、集群交付周期與模型迭代計(jì)劃愈發(fā)難以同步,導(dǎo)致DeepSeek多次出現(xiàn)“等芯片、等適配、等優(yōu)化”的情況,發(fā)布時(shí)間一延再延。
上述人士認(rèn)為,當(dāng)前,DeepSeek短期要做的是穩(wěn)定體驗(yàn)、提升效率、加快迭代,通過(guò)V4的持續(xù)優(yōu)化修復(fù)口碑。中長(zhǎng)期必須解決的核心命題,則是算力引擎的系統(tǒng)性優(yōu)化—— 在訓(xùn)練效率、生態(tài)適配、集群調(diào)度、硬件組合上做出更務(wù)實(shí)的選擇,平衡自主可控與工程交付效率。
毋庸置疑,在這場(chǎng)大模型技術(shù)創(chuàng)新長(zhǎng)跑中,底層技術(shù)路線的選擇將決定后續(xù)長(zhǎng)期走向。V4的性價(jià)比突圍,給DeepSeek贏得了喘息時(shí)間,但不足以扭轉(zhuǎn)算力和模型迭代失速的頹勢(shì)。未來(lái)1-2年,能否重構(gòu)計(jì)算引擎、提升迭代效率、穩(wěn)定產(chǎn)品體驗(yàn),將決定其能否重回第一梯隊(duì)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.