科技前沿 2026年4月24日
4月24日,國內人工智能領域迎來重磅消息——DeepSeek正式發布并開源DeepSeek-V4系列預覽版本。這一消息迅速在社交媒體引發熱議,短短數小時內,相關話題在微博熱搜榜前五中占據三席。
雙模型并行,性能全面升級
據悉,本次發布的DeepSeek-V4系列包含兩款模型:DeepSeek-V4-Pro與DeepSeek-V4-Flash,分別采用先進的MoE架構,總參數規模達到1.6T(激活49B)與284B(激活13B),并統一支持最長100萬token上下文窗口。
![]()
相較于上一代V3.2模型,V4在Agent能力、世界知識與復雜推理任務上實現顯著提升。在數學、STEM及競賽型代碼等高難度任務中,DeepSeek-V4-Pro整體表現已接近GPT-5.4、Claude Opus 4.6等頂級閉源模型,成為目前開源模型的"天花板"。
成本大幅下降,國產芯片深度適配
此次發布的最大亮點之一,莫過于成本的大規模降低。官方數據顯示,DeepSeek-V4在長上下文效率上進行了激進優化,在100萬token場景下,單token推理計算量較V3.2下降約3.7至9.8倍,KV Cache占用降至約10%,整體成本暴降73%。
![]()
同時,DeepSeek-V4已獲得華為昇騰950超節點及寒武紀Day 0的適配支持,相關適配代碼已開源至GitHub社區,標志著國產算力與開源大模型路線的深度融合。
價格親民,開發者福利來襲
在API定價方面,DeepSeek-V4-Pro輸入命中緩存僅1元/百萬tokens,DeepSeek-V4-Flash更是低至0.2元/百萬tokens,遠低于業界平均水平。目前,該系列已上線官網與App,并同步開放API與模型權重。
![]()
長文本能力成標配,《三體》三部曲一鍵讀完
值得一提的是,百萬上下文已成默認能力。記者實測發現,該模型能夠高效處理《三體》三部曲級別的超長文本,實現"大海撈針"式信息檢索。
![]()
分析人士認為,DeepSeek-V4的發布不僅展現了國產AI的技術實力,更標志著開源大模型在國產算力生態下的實際落地能力,為國內開發者提供了前所未有的開放選項。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.