![]()
從2025年年底,到2026年春節(jié),再走過今年第一季度。Deepseek-V4千呼萬喚始出來。
![]()
4月24日,Deepseek官網(wǎng)上線DeepSeek-V4預(yù)覽版(以下簡稱“DeepSeek-V4”)并同步開源。
從DeepSeek-R1到DeepSeek-V4,一年間,AI市場競爭已經(jīng)發(fā)生太多變化。
去年DeepSeek R1發(fā)布時,市場的觀感是“驚艷”,因為同期產(chǎn)品里,像它這樣性能強又成本低的并不多。
而DeepSeek-V4到來時,大模型廠商們已經(jīng)上新多輪。比如在DeepSeek-V4上線當(dāng)日凌晨(北京時間),OpenAI發(fā)布了新一代大模型GPT-5.5。而就在前一天(4月23日),騰訊發(fā)布了Hy3 preview模型。
關(guān)于DeepSeek-V4,DeepSeek在官方賬號只是低調(diào)樸素地介紹:“DeepSeek-V4 擁有百萬字超長上下文,在Agent能力、世界知識和推理性能上均實現(xiàn)國內(nèi)與開源領(lǐng)域的領(lǐng)先。”
今天,開機(jī)實驗室就準(zhǔn)備實測Deepseek-V4,看看表現(xiàn)如何。
可理解超長文本
DeepSeek-V4分為Pro與Flash兩個版本。
Pro版總參數(shù)1.6萬億、激活參數(shù)490億,主打旗艦性能;Flash版總參數(shù)2840億、激活參數(shù)130億,主打輕量高效。
大部分C端用戶使用DeepSeek是通過網(wǎng)頁或者APP,根據(jù)官方公告,進(jìn)入網(wǎng)頁/APP端后,專家模式對應(yīng)的模型是DeepSeek-V4-Pro;快速模式背后的模型則是DeepSeek-V4-Flash。
百萬上下文,是DeepSeek此次更新的亮點之一,兩款模型均全系標(biāo)配100萬Token上下文窗口,可一次處理整本著作或百萬字合同等超長文本。
開機(jī)實驗室嘗試將近90萬字的《三體》三部曲文本發(fā)送給DeepSeek解讀,在快速模式下,DeepSeek可以閱讀全文并給出正確的結(jié)論。
![]()
![]()
DeepSeek還表示,1M(一百萬)上下文將是DeepSeek所有官方服務(wù)的標(biāo)配。
目前,能將上下文推至百萬級別的模型并不算多,除了DeepSeek-V4,谷歌 Gemini 系列(1M+)、Anthropic Claude Opus 5(1M)等。
開機(jī)實驗室同時也對豆包、元寶等模型進(jìn)行實測,但這些模型暫時還無法閱讀這么長的內(nèi)容,需要搜網(wǎng)絡(luò)資料才能給出答案。
![]()
![]()
考AI腦筋急轉(zhuǎn)彎,是測試AI語境理解和邏輯推理能力的方式之一。
“我要洗車,距離洗車店50米,我開車去還是走路去?”前段時間,這個問題“難倒”了一眾AI,大部分大模型給出的答案都是“走路去”。
但據(jù)開機(jī)實驗室實測,在快速模式下,DeepSeek建議“走路去”,但是給出了一個算得上可行的解決方案:走到店里讓店員過來開。
![]()
專家模式下,DeepSeek很輕松地發(fā)現(xiàn)了問題,建議“開車去”,還嘗試猜測了用戶提出這個問題的顧慮,并表示不用擔(dān)心。
![]()
不過,DeepSeek的此次的更新不局限于此。
DeepSeek-V4 針對 Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 產(chǎn)品進(jìn)行了適配和優(yōu)化,在代碼任務(wù)、文檔生成任務(wù)等方面表現(xiàn)均有提升。
下圖為DeepSeek-V4-Pro 在某 Agent 框架下生成的PPT內(nèi)頁。
![]()
據(jù)DeepSeek,目前 DeepSeek-V4 已成為DeepSeek公司內(nèi)部員工使用的 Agentic Coding 模型,據(jù)評測反饋使用體驗優(yōu)于 Sonnet 4.5,交付質(zhì)量接近 Opus 4.6 非思考模式,但仍與 Opus 4.6 思考模式存在一定差距。
定價層面,DeepSeek-V4-Pro是輸入價格為輸入(未命中)12 元 / 百萬 token、(命中)1 元;輸出 24 元;DeepSeek-V4-Flash是輸入價格為每百萬輸入(未命中)1 元 / 百萬 token、(命中)0.2 元;輸出 2 元。
![]()
從“參數(shù)競賽”到“能力競賽”再到“價值競賽”
和去年DeepSeek-R1登場后拉動AI競爭不同,今年,在DeepSeek-V4 登場之前,業(yè)界就已經(jīng)開卷了。
先是春節(jié)期間,騰訊、阿里、字節(jié)等大廠又是發(fā)紅包,又是聯(lián)動春晚,吸引用戶體驗;再是這段時間一個大模型“上新”小高潮。
越來越密集的產(chǎn)品發(fā)布印證了這樣一個趨勢:2026年模型大戰(zhàn)正在從堆參數(shù)、拼速度,正式轉(zhuǎn)向比落地、比成本。
DeepSeek-V4發(fā)布同日凌晨(北京時間),OpenAI發(fā)布GPT5.5,幾天前,這家公司發(fā)布的GPT image 2在圖像生成上表現(xiàn)出的以假亂真程度以及廣泛的場景適用性讓不少用戶陷入恐慌。
而DeepSeek-V4發(fā)布一天前(4月23日),騰訊混元Hy3 preview語言模型發(fā)布并開源。
Hy3 preview是騰訊2月宣布混元重建預(yù)訓(xùn)練和強化學(xué)習(xí)的基礎(chǔ)設(shè)施后訓(xùn)練的第一個模型,它的定位是“實用主義”。
在參數(shù)規(guī)模上,Hy3 Preview比混元2.0要小,總參數(shù)295B,激活參數(shù)21B,最大支持256K上下文。但據(jù)騰訊,其在復(fù)雜推理、指令遵循、上下文學(xué)習(xí)、代碼、智能體等能力及推理性能上實現(xiàn)了大幅的提升。
同時,這個模型的應(yīng)用場景范圍不小。上線當(dāng)日,Hy3 preview已在元寶、ima、CodeBuddy、WorkBuddy、QQ等上線,微信公眾號、和平精英、騰訊新聞、微信讀書等多個主線產(chǎn)品也在陸續(xù)上線。
“我們在提升模型的智能上限,并通過與騰訊眾多產(chǎn)品的深度Co-Design,持續(xù)提升模型在真實場景中的綜合表現(xiàn),并開始探索特色模型能力。” 騰訊首席AI科學(xué)家姚順雨指出。
IDC中國研究經(jīng)理程蔭在DeepSeek-V4發(fā)布后發(fā)文表示,DeepSeek-V4的發(fā)布,標(biāo)志著中國大模型行業(yè)正式從“參數(shù)競賽”(1.0時代)、“能力競賽”(2.0時代)進(jìn)入“價值競賽”(3.0時代)——以高效架構(gòu)、普惠成本、場景落地為核心,解決企業(yè)實際問題。
而大模型的競爭升級,也在推動AI產(chǎn)業(yè)鏈上下游發(fā)生變化。
中信證券認(rèn)為,對于整個AI產(chǎn)業(yè)來說,模型層,DeepSeek新一代模型有望與其他國產(chǎn)模型攜手,驅(qū)動中國AI加速走向世界,同時模型訓(xùn)推進(jìn)一步降本,更廉價的tokens驅(qū)動全球大模型API調(diào)用量整體增加。
AI應(yīng)用層,模型平權(quán)有助于緩解市場對于模型與應(yīng)用矛盾敘事帶來的焦慮,助力千行百業(yè)AIAgent落地,利好有壁壘的AI應(yīng)用公司。
而對于AI基礎(chǔ)設(shè)施,降本帶來用量增長使AI Infra受益,國產(chǎn)AI Infra與國產(chǎn)模型相向而行。
在DeepSeek-V4的技術(shù)報告里,DeepSeek提到,DeepSeekV4在英偉達(dá)GPU與華為昇騰NPU兩大硬件平臺上,完成了細(xì)粒度執(zhí)行分區(qū)(EP)方案的有效性驗證。
![]()
DeepSeek在發(fā)布價格時還表示,受限于高端算力,目前Pro的服務(wù)吞吐十分有限,預(yù)計下半年昇騰950超節(jié)點批量上市后,Pro的價格會大幅下調(diào)。
中信證券指出,AI應(yīng)用爆發(fā)對應(yīng)的國內(nèi)算力荒將會加速國產(chǎn)卡放量,其中對推理芯片的帶動更加直接。當(dāng)前國產(chǎn)大模型正積極適配國產(chǎn)算力卡,在國內(nèi)算力荒背景下國產(chǎn)推理芯片等AI芯片迎來爆發(fā)增長機(jī)遇,預(yù)估國內(nèi)AI芯片市場當(dāng)前國產(chǎn)化率約30~40%,2030年有望提升至60~70%。
作者:馮戀閣
微信編輯:vivian
責(zé)任編輯:肖道
制圖:Judy Chen
轉(zhuǎn)載授權(quán)、投稿、合作請聯(lián)系消道長:
消道長微信:ccrzhushou
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.