<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      漲價潮里,DeepSeek選擇了清場

      0
      分享至



      發現沒有,上周五DeepSeek V4發布后不到48小時,人們甚至還沒來得及用它跑完一個完整項目,官方就甩出了另一枚炸彈。

      Pro版本API價格限時2.5折,優惠期持續到5月5日。緊接著,Pro和Flash的輸入緩存命中價格一步到位,打到原價的十分之一。


      第一反應是困惑。

      3月以來,無論海外的OpenAI、Anthropic,還是國內的智譜、阿里、騰訊,AI產品與“降價”二字徹底絕緣。模型越做越大,API價格水漲船高,跑分結果一路往上,用戶對著賬單無話可說。行業在短短一個月內形成了驚人的默契:AI就該越來越貴,想體驗到更好的智能,就得付更高的價格。而DeepSeek V4 Pro的價格已經逼近國內AI產品的下限,Flash版本比舊模型還便宜。此時繼續降價,邏輯上無法解釋。

      第二反應是震驚。

      輸入緩存命中價格降到0.025元,在智能體時代說“接近免費”沒有夸張成分。而且緩存命中的降價是永久的,不是限時活動。一個自然的質疑隨之而來:這是不是文字游戲?必須緩存命中才能享受這個價格,實際使用中命中率能有多少?實測結果給出了答案:不是噱頭,是真的便宜。

      當國內外同行還在為幾塊錢的定價調整反復權衡時,DeepSeek直接把價格表里的小數點往左挪了一位。開發者眼里,這是慈善。競爭對手眼里,這是價格戰。但兩者都沒有觸及本質。

      這是在清場。是一場早已分出勝負的成本斬殺。

      DeepSeek之所以能在算力緊缺、人才流動的環境下敢于如此激進地調價,原因藏在那份58頁的技術報告中。它早已不需要燒錢換市場。它是在用一套從頭重構的底層架構,把大模型的推理成本推向了人們從未想象過的數量級。

      01

      記憶的工業化

      讀技術報告時,一個數字跳了出來:在百萬token上下文場景下,V4的KV Cache占用僅僅是前代V3.2的10%。十分之一的定價,源頭就在這里。

      要講清楚這件事,得從KV Cache說起。今天人們與大模型的對話遠比幾年前復雜,附上幾十頁的文檔作為參考資料已經司空見慣。模型必須把這些冗長的內容記住,才能正確回答問題。這種記憶就是KV Cache。

      問題在于,長篇大論帶來的記憶既復雜又臃腫。一本百萬字的書看起來輕薄,模型卻需要占用十幾張昂貴顯卡的顯存來保存記憶。實現長上下文窗口的成本,一直居高不下。

      有人選擇接受現實,DeepSeek選擇了另一種路徑:掀翻傳統的記憶方式。

      第一種新方法叫壓縮稀疏注意力。傳統注意力機制中,一個token對應一組KV向量。壓縮稀疏注意力的做法是,通過可學習的線性投影和Softmax函數計算出壓縮權重,將連續多個token的KV狀態在序列維度上融合成一個單一條目。

      翻譯成直覺能理解的話:以前模型需要逐字逐句記住用戶發來的內容,現在它學會段落總結,把每幾十個詞的核心意義濃縮成一句話。在V4 Pro中,壓縮率設為4,僅這一步,緩存體積在序列長度上直接縮減75%。

      第二種方法更加激進,叫重度壓縮注意力。它試圖把遠大于常規壓縮窗口的token記憶壓進一個條目,不做稀疏檢索,而是全局密集注意力計算。代價是計算開銷增加,回報是壓縮率驚人。在V4 Pro中,這一層的壓縮率是128。段落總結還夠,直接做篇章提煉,一整頁內容濃縮成幾個關鍵詞。

      但激進壓縮必付代價。局部細粒度信息和嚴格的因果關系,都會被這種暴力壓縮破壞。DeepSeek的解法是,在注意力機制中增加一個獨立分支:窗口大小為128的滑動窗口。最近128個token不被壓縮,以此保證模型對近期上下文的精確感知。緩存管理上,異構KV Cache架構將未壓縮token作為一種狀態獨立管理,讓高壓縮比下的回答質量得以維持。

      還有一步不能忽略:混合精度存儲與磁盤復用。KV Cache中的特征維度,只有用于旋轉位置編碼的最后64維保留BF16精度,其余全部量化為FP8格式。物理存儲又砍掉一半。

      在這些層層削減之后,緩存體積已被壓縮90%以上,因此V4可以將這些高度壓縮的KV條目直接放到廉價的固態硬盤中。用戶發起長文本請求時,系統從硬盤直接拉取已壓縮的緩存,跳過了昂貴的GPU預填充計算,同時極大節省了HBM顯存。

      成本降到十分之一,順理成章。

      這是一種記憶的工業化。過去,記憶是手工作坊,每個細節都要原樣保存。現在,記憶變成了流水線,有標準化工序、有壓縮算法、有分級存儲。冗余被剔除,本質被保留

      02

      算力的結構性瘦身

      除了顯存占用,推理計算時的浮點運算次數,是衡量算力消耗最主要的標準。在1M長上下文下,V4 Pro的單token推理FLOPs只有前代V3.2的27%。

      下降的核心,是一套動態稀疏選擇機制。即使有了壓縮緩存,查詢向量和前面幾萬個壓縮后的KV向量計算注意力分數,計算量仍然龐大。DeepSeek的做法是:對于當前查詢向量,模型通過下采樣和上采樣矩陣將其映射到低維隱空間,生成一個用于檢索的索引Query向量。這個索引向量與歷史緩存的壓縮塊計算粗略得分,每次生成token時只檢索得分最高的1024個壓縮KV條目,再進行后續的核心注意力計算。

      傳統注意力機制中,解碼計算復雜度隨上下文長度線性增長。壓縮稀疏注意力將復雜度強制截斷為常數級運算。當上下文長度達到一百萬時,常數級的計算量幾乎可以忽略不計。這是27%這個數字的結構性來源。

      與此同步推進的,是精度的系統性妥協。V4不僅將混合專家架構的專家權重量化為FP4精度,還首次將FP4深入注意力計算的核心。Query和Key向量的激活值緩存、加載、矩陣乘法,全部在FP4精度下運行。量化感知訓練期間,索引得分也從FP32降到BF16。硬件層面,FP4精度的吞吐量是FP8的兩倍。這種極低精度計算讓長上下文的注意力計算速度加倍,同時維持了99.7%的KV檢索召回率。

      99.7%的召回率值得品味。這意味著,算力下降了,精度幾乎沒有損失。過去人們本能地認為,更便宜意味著更差。DeepSeek用數據證明,這個等式不總是成立。在工程的世界里,冗余和裕度并不天然等于更好的結果。

      03

      底層的極致壓榨

      自頂向下看完整套算法優化,再往下一層,是DeepSeek一貫的看家本領:對底層基礎設施的徹底壓榨。這種優化已經到了“摳門”的地步,卻構成了集群吞吐量提升和降價護城河的真實來源。

      V4 Pro參數量達到1.6萬億,在國內僅次于Kimi系列模型。但這也是問題所在。混合專家架構中,專家并行的跨節點通信,隨著參數膨脹成為瓶頸。DeepSeek團隊用自研的TileLang語言編寫底層融合算子,將MoE層的計算按波次劃分。一波專家的通信一旦完成,GPU立刻開始計算,網絡層同時開始并行傳輸下一波專家的token。這種流水線式的重疊調度,將推理階段的常規工作負載加速了1.50到1.73倍,硬件利用率逼近極限。均攤到每個請求上的算力折舊成本,被進一步壓低。

      還有一個針對智能體應用場景的獨特優化。AI模型在執行復雜任務時,往往需要先運行一個額外的小模型進行意圖識別或工具調用的判斷。V4的解法更巧妙:在輸入序列后附加專用的特殊token進行標記。由于模型原生支持多級思考和長短期記憶管理,可以直接復用主模型的KV Cache來并行執行這些輔助任務。額外模型的維護成本和重復預填充的計算開銷,被一并消除。

      這一步的意義,不是省了幾臺服務器。它指向一種哲學層面的分工:工具和意圖之間的界限被模型內部化了。過去需要外部輔助系統完成的功能,現在被模型本身的結構所吸收。這是壓縮,也是統一。

      04

      定價權的轉移

      混合壓縮注意力疊加硬盤低成本緩存,等于十分之一的緩存命中價格。稀疏注意力加上FP4精度再加上底層極致榨取,等于2.5折的推理價格。理解了這些技術,就能看明白這次突如其來的降價,本質不在慈善,也不在價格戰。這是利用技術代差發動的降維打擊。

      說來有些諷刺。在國內AI市場漲價的主旋律中,行業在一個月內形成了心照不宣的默契:AI就該越來越貴。然后DeepSeek一言不發,讓這種默契化為泡影。自研的千億MoE架構、把單token成本打骨折的混合注意力機制,使得API價格降到對手不想、也不敢跟進的水平。

      這已經不是同一個維度的競爭。

      DeepSeek從未想過燒錢換市場,它背后是自研的整套推理框架,從底層算子到上層服務的全鏈路掌控。降價,只是因為成本真的降下來了。

      而那些選擇漲價的企業,無論是主動還是被動,無意中暴露了一個更殘酷的事實:它們的技術棧和成本結構,根本不在自己手里。

      這輪洗牌過后,大模型市場的定價權將發生轉移。

      過去,價格由“我能買到的最優模型成本”來定義。現在,價格由DeepSeek的自研模型成本來定義。當錨點已被砸到地板價,漲價的廠商會突然發現,手里的牌一張都打不出了。

      百萬級token上下文的廉價處理能力,讓過去因成本懸置而無法落地的長文本分析、復雜Agent任務、橫跨多輪的記憶與規劃,都獲得了經濟可行性。這不是一個模型能力的突破,這是應用層即將大爆發的底層許可。

      DeepSeek平臺及時打消了外界傳言“降價以應對競爭”的說法。“此次調整正是技術與規模效應形成正循環后,我們向市場自然傳導成本優勢。”這種表述,比任何反擊都更有力。

      05

      最后的話

      回顧整件事,有一條更深的線索。

      價格從來不只是數字,它是權力結構的物質外衣。當一個技術的定價權從供給方轉移到效率方手中,它意味著舊格局開始瓦解。

      20世紀初,福特用流水線把汽車價格從富人玩具打到工人階層可承受的范圍,背后的力量不是慈善,是生產效率的代際躍遷。今天DeepSeek把大模型API價格打到同行的十分之一,性質是一樣的。誰掌握了最底層的效率,誰就掌握了定價權。誰掌握了定價權,誰就定義了下一個時代的基礎設施。

      硅谷有一種廣為流傳的敘事:AGI將在某個實驗室被秘密誕生,然后單方面重塑世界。DeepSeek的實踐提供了一種更安靜的敘事:真正的權力轉移,不需要一次驚艷的跑分或一篇石破天驚的論文。它只需要讓技術報告里藏著一行小字,把成本打到所有人無法跟進的位置。然后用一個普通的周末,輕描淡寫地把價格表更新。

      Token終將變為水電一樣的基礎資源。這句話說了好幾年,一直像愿景。直到這個周末,它突然變成了可以用0.025元買到的東西。

      轉載開白 | 商務合作 | 內容交流
      請添加微信:cutstill
      添加微信請備注姓名公司與來意

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      網紅水果黑幕曝光!全是添加劑泡的,很多人天天買給孩子吃

      網紅水果黑幕曝光!全是添加劑泡的,很多人天天買給孩子吃

      泠泠說史
      2026-05-12 19:57:36
      空腹抽血,喝水算不算破壞?很多人意外!檢驗科醫生權威解答

      空腹抽血,喝水算不算破壞?很多人意外!檢驗科醫生權威解答

      環球網資訊
      2026-05-06 13:46:09
      曼城3-0大勝水晶宮,天才助攻腳后跟插花腳妙傳

      曼城3-0大勝水晶宮,天才助攻腳后跟插花腳妙傳

      何揎室內設計
      2026-05-14 05:42:56
      奪冠代價!阿森納沖刺雙冠或送切爾西5800萬,哈弗茨成關鍵

      奪冠代價!阿森納沖刺雙冠或送切爾西5800萬,哈弗茨成關鍵

      星耀國際足壇
      2026-05-13 14:03:59
      廈門國貿集團董事長辭職

      廈門國貿集團董事長辭職

      地產微資訊
      2026-05-13 19:00:59
      5000人圍堵唐寧街!英國猶太社區忍無可忍,大呼:這里已經不安全了

      5000人圍堵唐寧街!英國猶太社區忍無可忍,大呼:這里已經不安全了

      最英國
      2026-05-12 18:17:09
      “有這種媽,抑郁癥就好不了!”一段母子倆出游視頻,令人窒息

      “有這種媽,抑郁癥就好不了!”一段母子倆出游視頻,令人窒息

      妍妍教育日記
      2026-05-07 10:30:13
      外交防線全面失守!特朗普無視日本直飛北京,俄羅斯補刀高市絕望

      外交防線全面失守!特朗普無視日本直飛北京,俄羅斯補刀高市絕望

      南宗歷史
      2026-05-14 03:03:38
      突發特訊!外交部通告:強烈譴責巴方有關行徑,引全球高度關注

      突發特訊!外交部通告:強烈譴責巴方有關行徑,引全球高度關注

      共工之錨
      2026-05-14 00:03:46
      沈騰近況曝光!陪妻兒江蘇度假劃船,狀態回春,很是帥氣

      沈騰近況曝光!陪妻兒江蘇度假劃船,狀態回春,很是帥氣

      金風說
      2026-05-14 00:44:23
      含金量,福登是英超史上無點球參與進球第二人

      含金量,福登是英超史上無點球參與進球第二人

      懂球帝
      2026-05-14 06:13:08
      登貝萊發威+比分2-0,巴黎圣日耳曼隊提前奪冠,豪取法甲5連冠

      登貝萊發威+比分2-0,巴黎圣日耳曼隊提前奪冠,豪取法甲5連冠

      側身凌空斬
      2026-05-14 04:57:56
      菲律賓一夜變天!伊梅臨陣反水,13票把親弟盟友踢出參議院

      菲律賓一夜變天!伊梅臨陣反水,13票把親弟盟友踢出參議院

      說歷史的老牢
      2026-05-13 04:18:14
      天塌了!江蘇一男子哭訴,因輕信親戚陷入60萬騙貸,家庭瀕臨破碎

      天塌了!江蘇一男子哭訴,因輕信親戚陷入60萬騙貸,家庭瀕臨破碎

      火山詩話
      2026-05-13 11:55:23
      轉發擴散!遺骸容貌復原,烈士可能來自東北

      轉發擴散!遺骸容貌復原,烈士可能來自東北

      極目新聞
      2026-05-10 13:36:42
      迄今為止,天安門城樓上只掛過12個人畫像,其中一人僅掛了1天

      迄今為止,天安門城樓上只掛過12個人畫像,其中一人僅掛了1天

      文史達觀
      2025-05-08 12:39:14
      俱樂部的意思?倫納特-卡爾刪除了與女友在海邊度假的照片

      俱樂部的意思?倫納特-卡爾刪除了與女友在海邊度假的照片

      懂球帝
      2026-05-13 07:33:06
      57歲男子幫母親與鄰居吵架時猝死 一審法院:對方承擔10%責任 賠償近12萬

      57歲男子幫母親與鄰居吵架時猝死 一審法院:對方承擔10%責任 賠償近12萬

      極目新聞
      2026-05-13 14:41:20
      工齡41.5年,湖北大爺養老金真不錯!

      工齡41.5年,湖北大爺養老金真不錯!

      樂天果果
      2026-05-13 14:07:54
      包臀裙的誘惑:不是吸引別人,是取悅自己

      包臀裙的誘惑:不是吸引別人,是取悅自己

      疾跑的小蝸牛
      2026-05-13 20:44:06
      2026-05-14 06:28:49
      硅基星芒AI
      硅基星芒AI
      錦緞旗下人工智能研究與媒體服務平臺
      59文章數 7關注度
      往期回顧 全部

      科技要聞

      阿里年營收首破萬億,AI終于不再是畫大餅

      頭條要聞

      女子閃婚獲千萬房產99%份額閃離后起訴分割 法院判了

      頭條要聞

      女子閃婚獲千萬房產99%份額閃離后起訴分割 法院判了

      體育要聞

      14年半,74萬,何冰嬌沒選那條更安穩的路

      娛樂要聞

      白鹿掉20萬粉,網友為李晨鳴不平

      財經要聞

      美國總統特朗普抵達北京

      汽車要聞

      C級純電轎跑 吉利銀河"TT"申報圖來了

      態度原創

      房產
      健康
      數碼
      教育
      軍事航空

      房產要聞

      卷瘋了!最低殺到7字頭!手握30萬,海口樓市橫著走!

      干細胞能讓人“返老還童”嗎

      數碼要聞

      徠芬智能卷發棒Styler發布,499元

      教育要聞

      收藏!2026棗莊三模試題+答案

      軍事要聞

      沙特被指3月曾對伊朗發動多次“報復性”空襲

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 中文字幕久久熟女蜜桃 | 久久天天躁狠狠躁夜夜躁| 精品人妻一二| 国产亚洲精品国产亚洲| 亚洲婷婷六月的婷婷| 中文午夜乱理片无码| 亚洲国产成人无码影院| 女同一区| 一区二区二区三区av | 狠狠热精品免费观看| 丰满少妇高潮无套内谢| 熟女Www亚洲国产W| 亚洲熟妇免费在线视频| 一区二区三区无码视频免费福利 | 久久婷婷久久一区二区三区| 国产精品视频九九九| 国语精品国内自产视频| 中文字幕va一区二区三区| 亚洲第一香蕉视频啪啪爽| 日韩精品一区中文字幕| 国产又大又粗又猛又爽的视频| 含紧一点h边做边走动免费视频| 东京热无码国产精品| 91免费在线播放| 国产免费一区二区三区在线观看| 在线a视频免费观看| 国产成人精品在线1区| jizz国产免费观看| 麻豆国产成人AV在线播放| 国产日韩欧美一区二区三区乱码| 亚洲人成网站18禁止| 日韩美女av二区三区四区| 欧美和黑人XXXX猛交视频| 亚洲人成网站999久久久综合 | 日韩一区二区三区不卡片| 国产精品无码久久AV嫩草| 亚洲麻豆av一区二区| 少妇被粗大的猛烈进出69影院一 | 东方四虎在线观看av| 五月婷婷中文字幕| 久久综合噜噜激激的五月天|