DeepSeek-V4終于更新了！一百萬超長上下文，Agent能力大幅增強，能力接近Opus 4.6

2026-04-24 12:23:56　來源: FounderPark

北京舉報

分享至

剛剛，期待已久的DeepSeek-V4 終于更新了。

DeepSeek 正式上線并開源了 DeepSeek-V4 的預(yù)覽版，分為 Pro 和 Flash 兩個版本。DeepSeek-V4 擁有百萬字超長上下文，在 Agent 能力、世界知識和推理性能上均實現(xiàn)國內(nèi)與開源領(lǐng)域的領(lǐng)先。

這次的更新力度不小，有兩個核心變化：一是，V4 擁有 1M 的超長上下文，1M 上下文已經(jīng)成為了標(biāo)配；二是，Agent 能力大幅的增強。

DeepSeek 官方提到，V4-Pro 在 Agentic Coding 評測中已經(jīng)達(dá)到了當(dāng)前開源模型最佳水平，也是公司內(nèi)部員工日常在使用的 Agentic Coding 模型。據(jù)內(nèi)部員工評測，V4-Pro 的反饋體驗優(yōu)于 Sonnet 4.5，交付質(zhì)量接近 Opus 4.6 非思考模式。

目前，DeepSeek-V4 已經(jīng)在官網(wǎng)、官方 App 中上線，用戶可以直接體驗。同時，API 也已同步上線，model_name 改為 deepseek-v4-pro 或 deepseek-v4-flash 即可調(diào)用。

??關(guān)注 Founder Park，最及時最干貨的創(chuàng)業(yè)分享

Founder Park 正在持續(xù)尋找值得被看見的 AI 團隊與項目。

我們將通過「AI 產(chǎn)品市集」、內(nèi)容報道、社群分發(fā)等方式，幫你觸達(dá)早期用戶、獲得真實反饋，以及建立關(guān)鍵連接。

如果你正在做 AI 相關(guān)的事，歡迎和我們聊聊。

01兩款新模型：Flash、Pro 版本

此次更新的 DeepSeek-V4 模型，按大小分為兩個版本：DeepSeek-V4-Pro 和 DeepSeek-V4-Flash。

V4-Pro 擁有 1.6T 總參數(shù)、49B 激活參數(shù)；V4-Flash 為 284B 總參數(shù)、13B 激活參數(shù)，兩款模型均原生支持 1M token 的上下文長度。

此外，V4-Flash 在 32T tokens 上完成預(yù)訓(xùn)練，V4-Pro 則在 33T tokens 上完成預(yù)訓(xùn)練。

DeepSeek-V4-Pro是這次發(fā)布的旗艦版本，各項能力均對標(biāo)頂級閉源模型。

其中，Agent 能力是突出的升級方向。在 Agentic Coding 評測中，V4-Pro 已達(dá)到當(dāng)前開源模型最佳水平，并在其他 Agent 相關(guān)評測中同樣表現(xiàn)優(yōu)異。據(jù) DeepSeek 內(nèi)部員工評測反饋，使用體驗優(yōu)于 Sonnet 4.5，交付質(zhì)量接近 Opus 4.6 非思考模式，但與 Opus 4.6 思考模式仍存在一定差距。

值得一提的是，V4-Pro 還針對 Claude Code、OpenClaw、OpenCode、CodeBuddy 等主流 Agent 產(chǎn)品進(jìn)行了專項適配和優(yōu)化，在代碼任務(wù)、文檔生成任務(wù)等方面的表現(xiàn)均有提升。

在世界知識方面，V4-Pro 在測評中大幅領(lǐng)先其他開源模型，僅稍遜于頂尖閉源模型 Gemini-Pro-3.1。

推理性能同樣亮眼，在數(shù)學(xué)、STEM、競賽型代碼的測評中，V4-Pro 超越了當(dāng)前所有已公開評測的開源模型，取得了比肩世界頂級閉源模型的成績。

DeepSeek-V4-Flash則是更多面向?qū)Τ杀竞退俣雀舾械膱鼍啊Ｏ啾扔?V4-Pro，V4-Flash 在世界知識儲備方面稍遜，但推理能力接近。

由于模型參數(shù)和激活更小，Flash 版能夠提供更加快捷、經(jīng)濟的 API 服務(wù)。在 Agent 評測中，V4-Flash 在簡單任務(wù)上與 V4-Pro 相當(dāng)，但在高難度任務(wù)上仍有一定差距。

02提出全新的注意力機制
一百萬上下文成為標(biāo)配

DeepSeek 官方特別提到，DeepSeek-V4 使用了一種全新的注意力機制，在 token 維度進(jìn)行壓縮，結(jié)合 DSA 稀疏注意力（DeepSeek Sparse Attention），實現(xiàn)了全球領(lǐng)先的長上下文能力。同時，相比傳統(tǒng)方法大幅降低了對計算和顯存的需求。從現(xiàn)在起，一百萬上下文將是 DeepSeek 所有官方服務(wù)的標(biāo)配。

DeepSeek-V4 和 DeepSeek-V3.2 的計算量和顯存容量隨上下文長度的變化

DeepSeek-V4 的技術(shù)報告中提到，這次架構(gòu)升級包含了三項核心創(chuàng)新：

CSA+HCA 混合注意力機制（Compressed Sparse Attention 與 Heavily Compressed Attention），這是實現(xiàn)超長上下文高效處理的核心所在；
mHC（Manifold-Constrained Hyper-Connections，流形約束超連接），用于強化傳統(tǒng)殘差連接，提升信號在層間傳播的穩(wěn)定性；
引入Muon 優(yōu)化器，帶來更快的收斂速度與更穩(wěn)定的訓(xùn)練過程；

在效率層面，技術(shù)報告同樣給出了更具體的量化數(shù)據(jù)：在 1M token 上下文場景下，V4-Pro 的單 token 推理 FLOPs 僅為 DeepSeek-V3.2 的27%，KV Cache 大小僅為10%。V4-Flash 的效率提升更為激進(jìn)，F(xiàn)LOPs 僅為10%，KV Cache 僅為7%。

03官網(wǎng)、App、API 同步上線，即日可用

目前，DeepSeek API 已經(jīng)同步上線了 V4-Pro 和 V4-Flash，支持 OpenAI ChatCompletions 接口與 Anthropic 接口。訪問新模型時，base_url 不變，model 參數(shù)改為 deepseek-v4-pro 或 deepseek-v4-flash 即可。

V4-Pro 與 V4-Flash 最大上下文長度均為 1M，同時支持非思考模式與思考模式。其中思考模式支持通過 reasoning_effort 參數(shù)設(shè)置思考強度（high / max）。對于復(fù)雜的 Agent 場景，DeepSeek 官方建議使用思考模式并將強度設(shè)置為 max。

需要注意的是，舊有的兩個模型名 deepseek-chat 與 deepseek-reasoner 將于三個月后（2026-07-24）停止使用。當(dāng)前階段內(nèi)，這兩個模型名分別對應(yīng)的是 deepseek-v4-flash 的非思考模式與思考模式。

更詳細(xì)的調(diào)用方式請參考官方文檔：api-docs.deepseek.com

開源權(quán)重和本地部署

DeepSeek-V4 模型開源鏈接：

https://huggingface.co/collections/deepseek-ai/deepseek-v4

https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

DeepSeek-V4 技術(shù)報告：

https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

轉(zhuǎn)載原創(chuàng)文章請?zhí)砑游⑿牛篺ounderparker

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.