今天上午,DeepSeek-V4模型預覽版正式上線,并且同步開源。距離上次發布R1已經過去15個月,這一年多里AI圈的更新節奏快到讓人眼花繚亂,DeepSeek卻一直保持著低調。今天,這份答卷終于交出來了。
![]()
而這次升級最大的亮點就是把百萬字上下文理解能力做成了標配,Agent能力也有了大幅提升,而且使用成本仍然主打“價格屠夫”。那么,它和上一代相比,就叫有哪些變化呢?
丨幾百頁的論文一次讀完
1M(一百萬tokens)上下文,是V4最明確的升級點,作為對比,上一代DeepSeek模型的上下文窗口為128K,這次直接翻了接近8倍。
![]()
這意味著什么?簡單來說,你可以一次性扔給AI一整本技術手冊、一份完整的法律合同,或者幾百頁的學術論文讓它通讀處理,而不需要分章節反復喂給它。對于寫代碼的人,丟一整個大型項目的代碼庫進去讓它理解和維護,也變成了現實場景。
背后的技術支撐是DeepSeek自研的DSA稀疏注意力機制(DeepSeek Sparse Attention)。這套方案在token維度進行壓縮,相比傳統的全量注意力計算,大幅降低了對算力和顯存的占用——這也是為什么1M上下文能作為標配,而不是只在高配版本上才提供。
![]()
兩個版本的選擇也不復雜。Pro版總參數1.6萬億,Agent編碼能力更強,官方內部已經用它替代Sonet 4.5作為日常編程工具,交付質量接近Opus 4.6非思考模式。Flash版2850億參數,在簡單任務上和Pro表現接近,但響應更快、價格更低。對于多數日常使用場景,Flash就夠用了。
價格方面,Flash版緩存命中時輸入約0.2元/百萬tokens,Pro版緩存命中約1元/百萬tokens。放在整個大模型API市場里看,這個定價依然有明顯的成本優勢,尤其是Flash版,幾乎是同類能力中最便宜的選擇。
丨國產算力全面接棒,下半年還有降價空間
V4的另一個看點,是國產算力的適配速度。
![]()
華為昇騰950在發布當天就宣布全面支持DeepSeek-V4系列,通過融合kernel和多流并行技術優化推理性能。基于昇騰950超節點,V4-Flash在8K輸入場景下單卡解碼吞吐可達1600TPS,延遲約10ms。同時,昇騰A3超節點系列產品也完成了全面適配,并提供了基于A3的訓練參考實現,方便開發者進行微調。
寒武紀這邊同樣動作迅速,宣布完成Day 0適配,基于自研高性能融合算子庫Torch-MLU-Ops對V4的新結構做了專項加速,適配代碼已開源到GitHub。
![]()
整體來看,DeepSeek-V4的定位很清晰:它不像當年橫空出世那么顛覆,而是穩扎穩打的進階者。1M上下文解決了長文本處理的剛需,Agent能力的提升讓它在編程和自動化任務上更有實戰價值,開源策略加上國產算力適配,則是在構建一個更可持續的生態基礎。
至于能不能追上頭部閉源模型?目前仍然有一定差距,由于不支持圖像視覺等多模態技術,單看文本能力,在arena.ai榜單位列第20位,編程能力則是第14位,整體位列開源模型第一,全球第九的水平。
![]()
據了解,DeepSeek此次并未給英偉達或AMD提供提前優化適配的機會,而是將早期訪問權限獨家開放給了國產芯片廠商,完成了從英偉達CUDA生態向華為CANN架構的底層遷移。而它后續不斷優化后,應該會在接下來的4.1或者4.2版本中給大家帶來更多的驚喜。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.