剛剛,期待已久的DeepSeek-V4 終于更新了。
DeepSeek 正式上線并開源了 DeepSeek-V4 的預(yù)覽版,分為 Pro 和 Flash 兩個版本。DeepSeek-V4 擁有百萬字超長上下文,在 Agent 能力、世界知識和推理性能上均實現(xiàn)國內(nèi)與開源領(lǐng)域的領(lǐng)先。
這次的更新力度不小,有兩個核心變化:一是,V4 擁有 1M 的超長上下文,1M 上下文已經(jīng)成為了標(biāo)配;二是,Agent 能力大幅的增強。
DeepSeek 官方提到,V4-Pro 在 Agentic Coding 評測中已經(jīng)達(dá)到了當(dāng)前開源模型最佳水平,也是公司內(nèi)部員工日常在使用的 Agentic Coding 模型。據(jù)內(nèi)部員工評測,V4-Pro 的反饋體驗優(yōu)于 Sonnet 4.5,交付質(zhì)量接近 Opus 4.6 非思考模式。
目前,DeepSeek-V4 已經(jīng)在官網(wǎng)、官方 App 中上線,用戶可以直接體驗。同時,API 也已同步上線,model_name 改為 deepseek-v4-pro 或 deepseek-v4-flash 即可調(diào)用。
??關(guān)注 Founder Park,最及時最干貨的創(chuàng)業(yè)分享
Founder Park 正在持續(xù)尋找值得被看見的 AI 團隊與項目。
我們將通過「AI 產(chǎn)品市集」、內(nèi)容報道、社群分發(fā)等方式,幫你觸達(dá)早期用戶、獲得真實反饋,以及建立關(guān)鍵連接。
如果你正在做 AI 相關(guān)的事,歡迎和我們聊聊。
01兩款新模型:Flash、Pro 版本
此次更新的 DeepSeek-V4 模型,按大小分為兩個版本:DeepSeek-V4-Pro 和 DeepSeek-V4-Flash。
![]()
V4-Pro 擁有 1.6T 總參數(shù)、49B 激活參數(shù);V4-Flash 為 284B 總參數(shù)、13B 激活參數(shù),兩款模型均原生支持 1M token 的上下文長度。
此外,V4-Flash 在 32T tokens 上完成預(yù)訓(xùn)練,V4-Pro 則在 33T tokens 上完成預(yù)訓(xùn)練。
DeepSeek-V4-Pro是這次發(fā)布的旗艦版本,各項能力均對標(biāo)頂級閉源模型。
![]()
其中,Agent 能力是突出的升級方向。在 Agentic Coding 評測中,V4-Pro 已達(dá)到當(dāng)前開源模型最佳水平,并在其他 Agent 相關(guān)評測中同樣表現(xiàn)優(yōu)異。據(jù) DeepSeek 內(nèi)部員工評測反饋,使用體驗優(yōu)于 Sonnet 4.5,交付質(zhì)量接近 Opus 4.6 非思考模式,但與 Opus 4.6 思考模式仍存在一定差距。
值得一提的是,V4-Pro 還針對 Claude Code、OpenClaw、OpenCode、CodeBuddy 等主流 Agent 產(chǎn)品進(jìn)行了專項適配和優(yōu)化,在代碼任務(wù)、文檔生成任務(wù)等方面的表現(xiàn)均有提升。
在世界知識方面,V4-Pro 在測評中大幅領(lǐng)先其他開源模型,僅稍遜于頂尖閉源模型 Gemini-Pro-3.1。
推理性能同樣亮眼,在數(shù)學(xué)、STEM、競賽型代碼的測評中,V4-Pro 超越了當(dāng)前所有已公開評測的開源模型,取得了比肩世界頂級閉源模型的成績。
![]()
DeepSeek-V4-Flash則是更多面向?qū)Τ杀竞退俣雀舾械膱鼍啊O啾扔?V4-Pro,V4-Flash 在世界知識儲備方面稍遜,但推理能力接近。
由于模型參數(shù)和激活更小,Flash 版能夠提供更加快捷、經(jīng)濟的 API 服務(wù)。在 Agent 評測中,V4-Flash 在簡單任務(wù)上與 V4-Pro 相當(dāng),但在高難度任務(wù)上仍有一定差距。
02提出全新的注意力機制
一百萬上下文成為標(biāo)配
DeepSeek 官方特別提到,DeepSeek-V4 使用了一種全新的注意力機制,在 token 維度進(jìn)行壓縮,結(jié)合 DSA 稀疏注意力(DeepSeek Sparse Attention),實現(xiàn)了全球領(lǐng)先的長上下文能力。同時,相比傳統(tǒng)方法大幅降低了對計算和顯存的需求。從現(xiàn)在起,一百萬上下文將是 DeepSeek 所有官方服務(wù)的標(biāo)配。
![]()
DeepSeek-V4 和 DeepSeek-V3.2 的計算量和顯存容量隨上下文長度的變化
DeepSeek-V4 的技術(shù)報告中提到,這次架構(gòu)升級包含了三項核心創(chuàng)新:
CSA+HCA 混合注意力機制(Compressed Sparse Attention 與 Heavily Compressed Attention),這是實現(xiàn)超長上下文高效處理的核心所在;
mHC(Manifold-Constrained Hyper-Connections,流形約束超連接),用于強化傳統(tǒng)殘差連接,提升信號在層間傳播的穩(wěn)定性;
引入Muon 優(yōu)化器,帶來更快的收斂速度與更穩(wěn)定的訓(xùn)練過程;
在效率層面,技術(shù)報告同樣給出了更具體的量化數(shù)據(jù):在 1M token 上下文場景下,V4-Pro 的單 token 推理 FLOPs 僅為 DeepSeek-V3.2 的27%,KV Cache 大小僅為10%。V4-Flash 的效率提升更為激進(jìn),F(xiàn)LOPs 僅為10%,KV Cache 僅為7%。
03官網(wǎng)、App、API 同步上線,即日可用
目前,DeepSeek API 已經(jīng)同步上線了 V4-Pro 和 V4-Flash,支持 OpenAI ChatCompletions 接口與 Anthropic 接口。訪問新模型時,base_url 不變,model 參數(shù)改為 deepseek-v4-pro 或 deepseek-v4-flash 即可。
V4-Pro 與 V4-Flash 最大上下文長度均為 1M,同時支持非思考模式與思考模式。其中思考模式支持通過 reasoning_effort 參數(shù)設(shè)置思考強度(high / max)。對于復(fù)雜的 Agent 場景,DeepSeek 官方建議使用思考模式并將強度設(shè)置為 max。
![]()
需要注意的是,舊有的兩個模型名 deepseek-chat 與 deepseek-reasoner 將于三個月后(2026-07-24)停止使用。當(dāng)前階段內(nèi),這兩個模型名分別對應(yīng)的是 deepseek-v4-flash 的非思考模式與思考模式。
更詳細(xì)的調(diào)用方式請參考官方文檔:api-docs.deepseek.com
開源權(quán)重和本地部署
DeepSeek-V4 模型開源鏈接:
https://huggingface.co/collections/deepseek-ai/deepseek-v4
https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4
DeepSeek-V4 技術(shù)報告:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
![]()
轉(zhuǎn)載原創(chuàng)文章請?zhí)砑游⑿牛篺ounderparker
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.