網易首頁 > 網易號 > 正文申請入駐

從128K到1M上下文，DeepSeek-V4這次升級了什么？

2026-04-24 15:56:10　來源: 機智貓

重慶舉報

分享至

今天上午，DeepSeek-V4模型預覽版正式上線，并且同步開源。距離上次發布R1已經過去15個月，這一年多里AI圈的更新節奏快到讓人眼花繚亂，DeepSeek卻一直保持著低調。今天，這份答卷終于交出來了。

而這次升級最大的亮點就是把百萬字上下文理解能力做成了標配，Agent能力也有了大幅提升，而且使用成本仍然主打“價格屠夫”。那么，它和上一代相比，就叫有哪些變化呢？

丨幾百頁的論文一次讀完

1M（一百萬tokens）上下文，是V4最明確的升級點，作為對比，上一代DeepSeek模型的上下文窗口為128K，這次直接翻了接近8倍。

這意味著什么？簡單來說，你可以一次性扔給AI一整本技術手冊、一份完整的法律合同，或者幾百頁的學術論文讓它通讀處理，而不需要分章節反復喂給它。對于寫代碼的人，丟一整個大型項目的代碼庫進去讓它理解和維護，也變成了現實場景。

背后的技術支撐是DeepSeek自研的DSA稀疏注意力機制（DeepSeek Sparse Attention）。這套方案在token維度進行壓縮，相比傳統的全量注意力計算，大幅降低了對算力和顯存的占用——這也是為什么1M上下文能作為標配，而不是只在高配版本上才提供。

兩個版本的選擇也不復雜。Pro版總參數1.6萬億，Agent編碼能力更強，官方內部已經用它替代Sonet 4.5作為日常編程工具，交付質量接近Opus 4.6非思考模式。Flash版2850億參數，在簡單任務上和Pro表現接近，但響應更快、價格更低。對于多數日常使用場景，Flash就夠用了。

價格方面，Flash版緩存命中時輸入約0.2元/百萬tokens，Pro版緩存命中約1元/百萬tokens。放在整個大模型API市場里看，這個定價依然有明顯的成本優勢，尤其是Flash版，幾乎是同類能力中最便宜的選擇。

丨國產算力全面接棒，下半年還有降價空間

V4的另一個看點，是國產算力的適配速度。

華為昇騰950在發布當天就宣布全面支持DeepSeek-V4系列，通過融合kernel和多流并行技術優化推理性能。基于昇騰950超節點，V4-Flash在8K輸入場景下單卡解碼吞吐可達1600TPS，延遲約10ms。同時，昇騰A3超節點系列產品也完成了全面適配，并提供了基于A3的訓練參考實現，方便開發者進行微調。

寒武紀這邊同樣動作迅速，宣布完成Day 0適配，基于自研高性能融合算子庫Torch-MLU-Ops對V4的新結構做了專項加速，適配代碼已開源到GitHub。

整體來看，DeepSeek-V4的定位很清晰：它不像當年橫空出世那么顛覆，而是穩扎穩打的進階者。1M上下文解決了長文本處理的剛需，Agent能力的提升讓它在編程和自動化任務上更有實戰價值，開源策略加上國產算力適配，則是在構建一個更可持續的生態基礎。

至于能不能追上頭部閉源模型？目前仍然有一定差距，由于不支持圖像視覺等多模態技術，單看文本能力，在arena.ai榜單位列第20位，編程能力則是第14位，整體位列開源模型第一，全球第九的水平。

據了解，DeepSeek此次并未給英偉達或AMD提供提前優化適配的機會，而是將早期訪問權限獨家開放給了國產芯片廠商，完成了從英偉達CUDA生態向華為CANN架構的底層遷移。而它后續不斷優化后，應該會在接下來的4.1或者4.2版本中給大家帶來更多的驚喜。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.