<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek V4的五個關鍵信號

      0
      分享至


      作者 | 林克

      4月24日,備受關注的DeepSeek的V4模型預覽版終于發布并同步開源了權重。

      這次發布的兩個版本,一個是總參數1.6萬億,激活49B的旗艦版V4 PRO,一個是經濟型V4-Flash,總參數284B,激活13B,均支持100萬token上下文,MIT協議完全開源。

      就在前一天,OpenAI剛剛上線GPT-5.5,每百萬輸出token定價30美元。今天DeepSeek V4-Flash的輸出定價是2元人民幣/百萬token,折合不到0.3美元。

      前后兩天,閉源與開源的兩種定價邏輯,面對面呈現在了市場面前。


      時點:三次跳票之后

      DeepSeek這一天來得不算突然,但比所有人預期的都晚。

      從去年底到今年2月、3月、4月初,DeepSeek V4的發布窗口推了三次,行業里各大模型的頻繁更新幾乎進入了最密集的時刻。

      必須承認在2026年4月末,百萬上下文已稱不上是絕對領先,Gemini、Qwen等都到了這個量級。這次DeepSeek V4落地,要回答的不是"能不能做到",而是"做到了之后,成本撐不撐得住"。

      V4給出的回答是一套全新的混合注意力架構。它在token維度引入壓縮機制,結合自研的DSA稀疏注意力,其讓模型在處理超長文本時不再對所有token做全量計算,而是區分輕重:強關聯的token精讀,弱關聯的壓縮或跳過。

      這套機制從預訓練階段就改變了模型處理長序列的方式。根據技術報告,V4還引入了流形約束超連接(mHC),替代傳統殘差連接來增強深層網絡信號傳播的穩定性,并使用Muon優化器提升訓練收斂速度。整個模型在超過32萬億token上完成了預訓練。

      實際效果用兩個數字就能概括:在百萬token上下文設置下,V4-Pro每處理一個token的算力消耗只有V3.2的27%,KV緩存占用只有10%。

      官方在公告里說得更清楚:"從現在開始,1M上下文將是DeepSeek所有官方服務的標配。"這意味著長上下文正式從"加價功能"變成了"默認配置",這對整個行業的成本預期是一次重新校準。

      矩陣:兩型號+三模式

      在這次發布中,旗艦V4-Pro和經濟型V4-Flash都支持三種推理模式:非思考模式(快速響應)、思考模式-高(顯式推理鏈)、思考模式-極限(推到模型能力邊界)。官方建議復雜Agent場景使用極限模式。

      DeepSeek對V4-Pro的定位給了一個直白的對標:內部員工已經把它當作日常Agentic Coding工具使用,體驗優于Claude Sonnet 4.5,交付質量接近Opus 4.6非思考模式,但與Opus 4.6思考模式仍有差距。

      推理性能方面,在數學、STEM和競賽型代碼評測中超越當前所有已公開評測的開源模型,比肩世界頂級閉源模型;世界知識大幅領先其他開源模型,稍遜于Gemini-Pro-3.1。

      V4-Flash的推理能力接近Pro版,但世界知識儲備稍遜;簡單Agent任務旗鼓相當,高難度任務有差距。

      這組自評有一處值得注意DeepSeek主動劃出了與Opus 4.6思考模式的差距,在國產大模型發布話術的傳統里,這種克制本身就是一種技術自信的表達。

      扳機:Token價格差

      隨著預覽版的公開,V4的API定價已隨發布同步上線。

      每百萬token,V4-Flash的輸入價是1元(緩存命中0.2元),輸出價2元;V4-Pro的輸入價12元(緩存命中1元),輸出價24元。官方注明這是預覽版定價,Pro版下半年算力擴容后將大幅下調。

      這組數字需要放在坐標系里看才有意義。

      Flash版每百萬token輸入1元——這個價格讓幾乎所有開發者都能無負擔地調用一個萬億參數級MoE架構的開源旗艦模型。

      對比之下,GPT-5.5前一天剛剛上線的輸出定價是30美元/百萬token,折合人民幣超過200元,與V4-Flash的2元輸出價差距超過100倍。即便拿V4-Pro的24元輸出價來比,差距仍在一個數量級以上。

      Pro版當前價格較高,但官方已經給出了明確的降價預期。背后的約束并非定價策略,而是算力供給——Pro版的高性能推理對芯片資源要求更高,當前服務吞吐十分有限。這也從側面印證了V4在自主算力適配上的深度投入。

      緩存命中的折扣幅度同樣值得關注。Flash的緩存命中價只有未命中價的五分之一,Pro是十二分之一。

      這意味著DeepSeek在用定價杠桿鼓勵一種使用方式:把系統提示詞、工具定義、文檔模板等固定內容放在請求頭部,讓緩存機制自動生效,對于Agent類應用,這恰好是最典型的調用模式。

      用Flash的白菜價鋪量,用Pro的高階能力撐住頂端場景,用緩存機制降低Agent開發者的邊際成本。每一刀都切在應用層最痛的地方。

      方向:Agent底座

      如果在V4的發布里只提煉一個關鍵標簽,那么Agent比百萬上下文或許更重要。

      官方明確寫道:V4針對Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent產品進行了專項適配和優化,在Agentic Coding評測中達到開源模型最佳水平。這份適配名單同時包含Anthropic的產品和國產開發者工具。

      這個信號很明確DeepSeek不打算自建應用生態,而是要成為Agent時代的底座供應商。

      這個選擇放在當前的行業格局里是一個有意識的取舍。Anthropic的年化收入過去四個月從90億美元翻到300億美元,增量幾乎全部來自Claude Code;Cursor一個代碼編輯器估值已到600億美元。應用層的錢在那里,但DeepSeek選擇不去碰。

      這說明它的定位不是下一個Anthropic,更有可能是Agent時代的基礎設施。

      長上下文+低價API+Agent適配的組合,本質上是把自己做成一個供電站,讓所有電器都能更便宜地跑起來。

      對于那些整天跟Token消耗作斗爭的Agent開發者來說,V4打開的是一個具體的場景:把整個代碼倉庫、完整的需求文檔、幾百輪歷史對話一次性塞進調用,不再需要切分、檢索、摘要這套工程繞路。過去做Agent最頭疼的就是上下文管理——每多一輪對話,token就指數級堆疊,成本和穩定性同時惡化。

      V4如果能在真實負載下兌現承諾,這個痛點的成本結構將被改寫一次。

      生態:模型、算力賽跑

      V4延期的這段時間里,國產開源大模型的戰場從未安靜過。

      今年農歷年前后出現了一次密集爆發:阿里Qwen3.5總參數3970億、激活僅170億,百萬token的API價低至0.8元,是Gemini-3-Pro的十八分之一;智譜GLM-5的代碼生成的HumanEval96.2%打到開源最強。

      4月繼續加速:Kimi K2.6在SWE-Bench Verified上拿到80.2%,幾乎追平Claude Opus 4.6;智譜GLM-5.1在SWE-Bench Pro上以58.4%超過了GPT-5.4和Claude Opus 4.6;Qwen 3.6 Plus也跨入百萬token上下文行列。

      Qwen、Kimi、GLM、MiniMax、MiMo,這些國產模型在國際開發者社區的出現頻率正在肉眼可見地上升。


      除了模型,算力測的匹配也在同步落地。

      華為在V4發布同日確認昇騰全系列產品——A2A3及最新的昇騰950已全面適配V4-FlashV4-Pro

      措辭是"雙方芯模技術緊密協同",意味著DeepSeek和昇騰的適配工作從模型研發階段就在同步推進。

      華為給出了一組具體的性能數據:基于昇騰950超節點,V4-Pro在8K輸入場景下實現了約20ms的單token解碼時延,單卡吞吐4700 TPS;V4-Flash可以做到約10ms時延,單卡吞吐1600 TPS。

      昇騰A3超節點上,V4-Flash在64卡大規模部署下單卡吞吐超過2000 TPS。

      這些數字背后是昇騰950在底層架構上的三項代際升級:原生支持FP8/MXFP4等低精度格式(內存占用降低50%以上,算力翻倍)、針對MoE稀疏訪存特征的硬件級優化,以及Vector與Cube單元共享片上內存的新設計。

      更值得關注的是工程生態層面的動作。

      華為同步開源了PyPTO編程范式,讓V4新架構中涉及的Attention壓縮、mHC等復雜算子的開發周期從周級縮短到天級,開發者不需要手動處理硬件層面的同步和數據搬運。

      寒武紀同樣在發布當天宣布,已基于vLLM框架完成V4-FlashV4-ProDay 0適配,代碼開源到GitHub

      兩家國產芯片廠商在模型發布首日就拿出了完整的推理部署方案,這個響應速度本身就說明,適配工作不是臨時趕出來的,而是跟模型研發深度咬合了很長時間。

      DeepSeek為這次底層算力遷移付出的工程代價不小。據此前報道,團隊重寫了大量核心代碼,完成了從CUDA生態到昇騰CANN框架的整套技術棧遷移,這也是V4反復跳票的原因之一。

      但當一個萬億參數級的開源旗艦模型,在發布首日就能跑在國產算力的全系列產品上,適配代碼直接開源,推理性能給出了具體的吞吐和時延數據而不是"即將支持"——這件事的意義,已超出了任何單一模型的評測范疇。

      無論模型還是算力,他們之間存在競爭關系,但從更大的維度看,它們都在證明了同一件事:

      中國AI研發的系統性能力不是一兩個特例,而是可以不斷連續性創新的生態。

      2025年1月,DeepSeek R1發布,引發美股單日市值蒸發超1萬億美元,被業界稱為人工智能領域的“斯普特尼克時刻”。

      今天V4的發布沒有那種戲劇性的震撼,但中國AI研發已經從“偶爾令人震撼”進入了“持續在場”階段。

      DeepSeek在公告末尾引了《荀子》中的一句話:

      不誘于譽,不恐于誹,率道而行,端然正己。

      放在一家三次跳票、核心人才流失、剛傳出融資的公司身上,這句話讀起來有幾分倔強。

      但在整個國產開源模型群體站出來的2026年,這句話不只屬于DeepSeek,更屬于中國所有AI創新堅定前行的腳步。

      *本文為全天候科技原創作品,未經授權不得轉載,如需轉載,請在后臺回復“轉載”二字,獲取轉載格式要求。


      點“在看”,變好看哦。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      “摸奶子”擦邊神反轉,OPPO公關部有高人指點

      “摸奶子”擦邊神反轉,OPPO公關部有高人指點

      首席品牌觀察
      2026-05-14 16:52:18
      馬尼拉國會響起15聲槍響,菲特工沖進參議院抓人,全程被直播?

      馬尼拉國會響起15聲槍響,菲特工沖進參議院抓人,全程被直播?

      肖茲探秘說
      2026-05-14 15:05:17
      馬斯克表示:他絕對能建造出比中國任何公共交通系統都更好的系統

      馬斯克表示:他絕對能建造出比中國任何公共交通系統都更好的系統

      華史談
      2026-04-14 13:00:13
      最新戰報!國羽2勝6負,石宇奇橫掃進8強,4項剩獨苗,男雙3連敗

      最新戰報!國羽2勝6負,石宇奇橫掃進8強,4項剩獨苗,男雙3連敗

      劉姚堯的文字城堡
      2026-05-14 16:35:31
      一夜情后勒索NBA雄鹿老板12.15億美元,羅某在登機回國時被捕

      一夜情后勒索NBA雄鹿老板12.15億美元,羅某在登機回國時被捕

      聽心堂
      2026-05-12 13:19:43
      U17亞洲杯大冷:越南3-2力壓韓國奪頭名!8強誕生,國足戰東道主

      U17亞洲杯大冷:越南3-2力壓韓國奪頭名!8強誕生,國足戰東道主

      侃球熊弟
      2026-05-14 04:12:36
      加速糖尿病惡化的原因:喝酒排第4,排第1的,很多人還在天天做

      加速糖尿病惡化的原因:喝酒排第4,排第1的,很多人還在天天做

      醫學科普匯
      2026-05-07 22:35:04
      11年前優衣庫男女主現狀曝光,他們還在一起生了兩個孩子

      11年前優衣庫男女主現狀曝光,他們還在一起生了兩個孩子

      半糖甜而不膩
      2026-04-06 12:09:15
      俄軍會不會發生突然間崩盤?

      俄軍會不會發生突然間崩盤?

      霹靂炮
      2026-05-13 22:31:33
      鄧亞萍一句話說透,張本智和不是輸給梁靖崑,是輸給了這三個字

      鄧亞萍一句話說透,張本智和不是輸給梁靖崑,是輸給了這三個字

      小叨娛樂
      2026-05-14 13:27:43
      悲催!網傳36歲未婚男不堪逼婚自殺,上午發現下午火葬,骨灰丟掉

      悲催!網傳36歲未婚男不堪逼婚自殺,上午發現下午火葬,骨灰丟掉

      火山詩話
      2026-05-14 07:23:53
      北約演習現場被烏克蘭“團滅”,瑞典軍隊三次緊急叫停訓練

      北約演習現場被烏克蘭“團滅”,瑞典軍隊三次緊急叫停訓練

      桂系007
      2026-05-13 21:12:56
      重磅達成協議!巴西后腰同意加盟曼聯,周薪10萬英鎊敲定

      重磅達成協議!巴西后腰同意加盟曼聯,周薪10萬英鎊敲定

      夜白侃球
      2026-05-14 09:01:43
      美巴28億簽15年稀土協議,中國買家被終止合作

      美巴28億簽15年稀土協議,中國買家被終止合作

      愿你余生安好嘴角帶笑
      2026-05-14 07:18:51
      我出軌后丈夫再未親近我,20年后體檢,醫生說的話讓我當場淚崩

      我出軌后丈夫再未親近我,20年后體檢,醫生說的話讓我當場淚崩

      游戲收藏指南
      2026-05-14 17:00:07
      全球最毒的十大垃圾食品榜單,泡面未上榜,“真兇”很多人喜歡吃

      全球最毒的十大垃圾食品榜單,泡面未上榜,“真兇”很多人喜歡吃

      小談食刻美食
      2026-05-14 08:01:03
      3-2逆轉中亞勁旅,中國男足2連勝,比韓國凈勝球少屈居第二

      3-2逆轉中亞勁旅,中國男足2連勝,比韓國凈勝球少屈居第二

      側身凌空斬
      2026-05-13 21:30:47
      馬斯克說會談很順利,黃仁勛點贊、庫克比耶

      馬斯克說會談很順利,黃仁勛點贊、庫克比耶

      財聞
      2026-05-14 13:34:16
      一個下機順序看透白宮未來新格局,馬斯克緊跟特朗普,魯比奧屈后

      一個下機順序看透白宮未來新格局,馬斯克緊跟特朗普,魯比奧屈后

      阿雹娛樂
      2026-05-14 16:08:30
      驚險!深圳街頭驚現巨蟒盤踞馬路正中嚇壞路人

      驚險!深圳街頭驚現巨蟒盤踞馬路正中嚇壞路人

      看看新聞Knews
      2026-05-14 12:28:05
      2026-05-14 17:51:00
      全天候科技 incentive-icons
      全天候科技
      幫助投資者理解科技
      3834文章數 15003關注度
      往期回顧 全部

      科技要聞

      馬斯克說會談很順利 黃仁勛點贊 庫克比耶

      頭條要聞

      媒體:中美元首會談超2小時15分鐘 兩國關系有新定位

      頭條要聞

      媒體:中美元首會談超2小時15分鐘 兩國關系有新定位

      體育要聞

      爭議抽象天王山,和季后賽最穩定中鋒

      娛樂要聞

      何九華官宣當爸!全程不提孩子媽

      財經要聞

      習近平同美國總統特朗普會談

      汽車要聞

      新時代傳統豪華是什么樣? 上汽奧迪E7X給出了自己的答案

      態度原創

      本地
      親子
      時尚
      公開課
      軍事航空

      本地新聞

      用蘇繡的方式,打開江西婺源

      親子要聞

      恒河猴實驗給出答案:沒人回應的孩子,生存底線到底是什么?

      T恤+低腰闊腿褲、襯衫+低腰半裙,今年夏天最時髦的搭配,誰穿誰好看!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美以伊戰爭期間以總理密訪阿聯酋

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日韩一区精品视频一区二区| 日本免费二三本道| 精品九九视频| 乱伦视频网| 国产精品国产自产拍高清| 欧美射图| 日日视频色| 美女福利一区二区三区| 久久人人爽人人爽人人av| 国产精品午夜福利在线观看| 超碰人人澡| 亚洲AV色图| 在线观看国产小视频| 国产精品久久蜜臀av| 国产一区二区精品久久呦| 色吊丝网站| 亚洲精品无| 国内揄拍国内精品少妇| 日本va亚洲va欧洲va| 人人妻人人狠人人爽天天综合网| 欧洲一区二区| 日本熟妇大乳| 在线综合网| 久久无码中文字幕久久无码app| 熟妇人妻久久精品一区二区| 波多野一区二区无码中文字幕| 无码中文字幕av免费放| 亚洲综合欧美色五月俺也去| 色一伦一情一区二区三区| 亚洲国产a片。| 亚洲超碰97无码中文字幕| 亚洲欧美电影在线一区二区| 中文字幕日韩区二区三区| 超碰日日夜夜| 真实播放国产乱子伦视频| 91久久国产成人免费观看| 亚洲国产一区二区三区亚瑟| 丁香五月婷激情综合第九色| 亚洲熟女少妇一区二区| 天堂a无码a无线孕交| www.啪啪白浆|