<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      黃仁勛說這是"災難":DeepSeek在華為芯片上跑通了

      0
      分享至

      DeepSeek V4的API定價出來了——Flash版輸入1元/百萬token,Pro版12元。同期GPT-5.4和Claude Opus 4.6的調用成本,大約是它的50倍。

      不是便宜一半,是便宜50倍。這個數字大到不像是同一場比賽里的報價。

      但價格本身不是重點。往回看三代產品——V2訓練成本是GPT-4 Turbo的1/70,V3是GPT-4的1/14,R1是GPT-4o的1/20。DeepSeek畫出了一條陡峭的成本下降曲線。連奧爾特曼自己都說,AI成本每12個月降10倍,比摩爾定律還猛。

      V4還帶來了一個更大的變量:它在技術報告中明確寫入了華為昇騰NPU與英偉達GPU的并列驗證,是首個在昇騰平臺上原生適配的前沿大模型。黃仁勛在播客里說,這件事是"災難性的"。英偉達的護城河不是GPU算力本身,而是CUDA作為默認起點的軟件生態位。

      便宜50倍,還在昇騰上跑通了。DeepSeek到底是怎么做到的?這條效率路線走到終局,又意味著什么?



      0150倍價差

      DeepSeek V4的API定價出來了:Flash版輸入1元/百萬token,輸出2元;Pro版輸入12元,輸出24元。緩存命中的情況下,Flash版輸入價格壓到了0.2元/百萬token。

      同期GPT-5.4和Claude Opus 4.6的API調用成本,大約是V4的50倍。

      V4在MIT協議下完全開源,發布時間恰好卡在OpenAI上線新Agent功能的前一天。貼身肉搏的意味已經很明顯了。

      但V4的定價并不是一次孤立的降價事件。往回看三代產品,DeepSeek畫出了一條陡峭的成本下降曲線。

      2024年初,V2的訓練成本比GPT-4 Turbo下降至1/70,靠的是MLA架構和MoE稀疏架構的組合創新。同年底,V3的訓練成本560萬美元,相比GPT-4的7800萬美元降至1/14。緊接著,R1的訓練成本600萬美元,對標GPT-4o約1.2億美元的訓練開支,壓到了1/20。

      三代產品,每代都在往下打一個數量級。這不是一次促銷,是一條曲線。



      一年前,R1發布當天,英偉達單日市值蒸發近6000億美元,"DeepSeek時刻"成了整個科技圈的記憶錨點。V4把這個故事又往前推了一步。

      當然,這條曲線不是沒有爭議。谷歌DeepMind負責人哈薩比斯直言DeepSeek的成本數據"被報小了,并且有些誤導性",聲稱公司"只公布了最終訓練階段的成本,而這只是總成本的一小部分"。分析機構SemiAnalysis進一步估算,DeepSeek在硬件上的花費遠高于5億美元,論文中600萬美元的數字只是預訓練運行的GPU成本。

      DeepSeek硬件投入即便超過5億美元,這是一筆包含芯片采購在內的資本開支;而GPT-4o的訓練成本約1.2億美元,指的是單次訓練運行的算力費用,兩者口徑并不相同。不過,即便把OpenAI背后數十億美元的算力基礎設施投入也納入考量,DeepSeek在單次訓練成本上的優勢依然是數量級的。爭議的焦點恰恰證明了結論:即便成本被低估了,它依然便宜得離譜。

      這不只是DeepSeek一家的故事。從GPT-4到GPT-4o,OpenAI自己的每token價格也降了約150倍。即便降了這么多,DeepSeek的API價格仍然比OpenAI便宜95%。

      奧爾特曼自己在2025年2月的文章中寫得明白:使用特定水平AI的成本每12個月下降約10倍。摩爾定律曾以每18個月翻一倍的速度改變世界,而AI成本的下降"更加強勁"。

      當你的競爭對手親口幫你論證了你的敘事,這個敘事就不只是敘事了。AI行業正在經歷自己的摩爾定律,而DeepSeek,是這條定律最激進的執行者。

      定律背后的機制是什么?三代產品的成本為什么能一路往下砸?答案藏在DeepSeek的技術路線里。

      02從算法蔓延到芯片

      V3訓練只用了2048張H800。同級別模型的訓練集群動輒上萬張卡,但DeepSeek用這2048張卡訓出了對標GPT-4的模型,靠的是一個當時沒人敢在大規模訓練中真正用上的技術:FP8混合精度。

      英偉達的Transformer Engine早就支持FP8訓練,但在V3之前,沒有開源大模型真正在訓練階段跑通過FP8。DeepSeek第一個吃螃蟹,用細粒度量化策略把激活值按1x128的tile量化、權重按128x128的block量化,在不損失模型質量的前提下把計算成本大幅壓低。

      武器不在多,在會用。2048張卡就是別人上萬張卡的活。

      V4在這條路上又往前走了一大步,直接改造了注意力機制本身。

      核心是兩種全新的注意力結構。CSA(壓縮稀疏注意力)把每4個token的KV緩存壓縮成1個條目,再用一個叫Lightning Indexer的篩選器從所有壓縮塊中只挑出最相關的512個來計算。

      HCA(層次化壓縮注意力)更激進,壓縮比達到128倍,直接跳過篩選環節做全量計算來抓全局結構。兩種注意力交錯配置,再配合滑動窗口保留最近128個token的原始KV,多管齊下把百萬token長文本的推理開銷打了下來。

      深度求索方面直接表態:"從現在開始,百萬上下文將是DeepSeek所有官方服務的標配。"以前百萬token是各家發布會上拿來炫技的指標,現在是默認參數。

      當技術成本低到可以成為默認選項時,它就不再是競爭優勢,而是基礎設施的一部分。

      效果直接寫在基準分上。

      V4-Pro,1.6萬億參數、激活49B,在100萬token上下文下處理一個新token需要的算力只有V3.2的27%,KV緩存只占10%。資源消耗砍到四分之一。

      而頂配Pro Max呢?知識基準SimpleQA拿下57.9分,比開源最佳高出20個點;數學競賽Putnam 2025做到120/120滿分;編程競賽Codeforces在人類選手中排第23。三個分屬完全不同類型的任務,同時沖頂。



      算力用了四分之一,成績沖到了第一。這不是降本增效,是換了一套物理定律在跑。

      但V4最值得關注的變量,不在算法層。

      V4技術報告3.1節寫了一句話:"我們在NVIDIA GPU和華為昇騰NPU兩個平臺上驗證了這個細粒度的專家并行方案。"兩個平臺并列,寫在驗證結論里。這不是"兼容適配"的措辭,是"原生支持"的姿態。

      這套方案的核心是把MoE的通信和計算切成更細的顆粒按"波"調度,通用推理加速1.50到1.73倍,強化學習長尾小批次最高加速1.96倍。昇騰已經從備選項變成了并列選項。

      遷移并不輕松。據接近DeepSeek的工程師透露,V4從CUDA到CANN的適配過程中,最耗時的不是算子重寫,而是精度對齊。同樣的模型在英偉達和昇騰上跑出完全一致的數學結果,需要反復調試。

      此前用910C訓練時,DeepSeek翻過車:1024卡集群梯度同步超時、CANN舊版缺少關鍵算子,穩定性一度不足。950PR針對性地補上了這些短板:芯片間帶寬翻了3倍,CANN Next內置了FlashAttention和PagedAttention算子。

      真正的技術遷移不是換一個品牌的芯片,是讓兩套完全不同的硬件跑出一樣的數學結果。DeepSeek把這條路蹚通了,后來者的門檻就低了一大截。

      華為的策略也很清楚。昇騰950PR在FP4精度下算力達到2 PFLOPS,芯片間互聯帶寬2TB/s。CANN Next的定位不是推倒重來,是無縫替換:新增SIMT編程模型與CUDA高度對標,讓開發者沿用CUDA的編程習慣,最終編譯出昇騰優化程序。

      黃仁勛在帕特爾的播客專訪中說出了英偉達真正害怕什么。不是中國做出好模型,而是好模型不再以CUDA為默認優化起點。

      英偉達的護城河從來不是GPU本身的算力,而是CUDA作為"事實標準"運行了近二十年的軟件生態位。幾乎所有主流AI框架、算子庫、開源模型的首發優化,都把CUDA當作默認起點。DeepSeek在昇騰上完成原生適配,戳破的恰恰是這條鏈條的起點:至少存在一條真實、可運行、被頂級模型驗證過的非CUDA路徑。

      當世界上最好的開源模型證明了一條完整的非CUDA路徑,二十年的生態壁壘就出現了第一道裂縫。效率路線從算法蔓延到芯片,蔓延到了英偉達最害怕的那個位置。

      03算力變水電

      中信建投在V4發布后的研報里做了一個劃分:R1回答的問題是"中國能不能做出世界級模型",V4回答的是兩個更具體的問題——"能不能在算力封鎖下持續進化",以及"大模型能不能變成能賺錢的企業級產品"。

      第一個問題,學術界已經給了答案。2025年9月,R1論文登上Nature封面,8位專家逐條審稿,這是全球首個通過頂級學術期刊同行評審的主流大模型。"中國能不能做"這個問題翻篇了。

      第二個問題才是V4真正要回答的。

      巨頭們在用最傳統的方式搶市場。2026年春節期間,字節、阿里、騰訊三家燒掉近百億元拉新。千問豪擲30億元送"奶茶大禮包",豆包登上央視春晚,元寶拋出10億元現金紅包。

      QuestMobile數據顯示,截至2026年2月,豆包活躍用戶1.03億、千問3245萬,DeepSeek 2477萬排第三。

      但DeepSeek的窘境和巨頭不同。日活從1.2億飆到約2億,半年增長超67%,算力卻只擴了約8.3%。日均算力成本超千萬元,今年已經三次大規模宕機,每次都在晚間用戶高峰期爆發。

      用戶增長67%,算力增長8.3%。這個剪刀差就是DeepSeek必須走效率路線的原因,也是V4必須跑在昇騰上的原因。

      融資信號也在轉向。2025年初DeepSeek最火的時候,梁文鋒拒絕了所有投資機構。他曾提出類似OpenAI與微軟投資協議的回報上限條款,沒有任何機構接受,此后再沒跟投資人見過面。

      一年后的4月17日,DeepSeek傳出至少100億美元估值融資;五天后,路透社報道阿里和騰訊正在洽談投資,估值已被抬到200億美元以上。一位接近DeepSeek的投資人說:"這不是一個你出得起價就能進的標的,梁文鋒的篩選標準里,錢是最不重要的那一項。"

      一年前拒絕所有人,一年后所有人爭著進。變的不是梁文鋒的態度,是DeepSeek的位置。從技術驗證期走到了商業化拐點。

      DeepSeek"換芯"昇騰引發的連鎖反應正在擴散。阿里、字節、騰訊已向華為批量采購昇騰950PR,訂單合計數十萬顆,集中采購推動芯片價格近幾周上漲20%。當行業龍頭用腳投票跟進非CUDA路徑,效率路線就從一家公司的選擇變成了行業共識。

      商業化的數據也在印證拐點。智譜2025年全年收入7.24億元,同比增132%,MaaS API平臺年度經常性收入做到17億元,同比漲了60倍。大模型正在從燒錢的故事變成賺錢的生意。

      當行業里開始有人賺錢,"AI泡沫"的敘事就該換一個了。

      米勒在《巴倫》雜志的判斷提供了另一個坐標。他說,美中之間的差距不在人才、不在創新,而在訓練時投入的運算資源。這是典型的存量邏輯,誰的卡多誰贏。

      但DeepSeek做的是增量邏輯:讓每張卡的產出更高。V4在昇騰上跑通,就是用效率把存量差距變成了一個可以繞過去的問題。

      而政策信號,可能是三重信號中最耐人尋味的。

      工信部發布了《普惠算力賦能中小企業發展專項行動》,目標是到2028年底顯著降低中小企業使用算力的門檻。文件里出現了兩個概念:"算力銀行"和"算力超市"。企業可以把閑置算力存進去,按需取用,按卡時、核時甚至Token來計費。

      當政策開始用水電的邏輯來管理算力,前沿智能就真的在變成基礎設施。DeepSeek從算法層到芯片層一路把成本打下來,政策從頂層把算力變成公共服務。

      一個從供給側降本,一個從制度側普惠。兩條線交匯的那個點,就是AI不再是軍備競賽的那一天。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      電車,是時候交養路費了

      電車,是時候交養路費了

      第一財經資訊
      2026-05-29 10:11:25
      這跟不穿有啥區別!北京這一夜,31歲徐璐穿透視禮服,屬實辣眼睛

      這跟不穿有啥區別!北京這一夜,31歲徐璐穿透視禮服,屬實辣眼睛

      八斗小先生
      2026-05-29 19:24:16
      今晚,數百人準備在南京路排通宵!消費者:“預想到火爆,沒想到比預想的更火爆”

      今晚,數百人準備在南京路排通宵!消費者:“預想到火爆,沒想到比預想的更火爆”

      上觀新聞
      2026-05-30 01:04:23
      神舟二十二號安全返航,著陸瞬間濃煙滾滾,美國飛船為什么不會

      神舟二十二號安全返航,著陸瞬間濃煙滾滾,美國飛船為什么不會

      粵語音樂噴泉
      2026-05-30 01:45:29
      環塔悲歌:中國車手張秀軍不幸遇難!年僅37歲

      環塔悲歌:中國車手張秀軍不幸遇難!年僅37歲

      運動幫
      2026-05-30 07:59:50
      紹伊古承認俄羅斯在前線無法推進,理由是俄羅斯與56個國家作戰

      紹伊古承認俄羅斯在前線無法推進,理由是俄羅斯與56個國家作戰

      山河路口
      2026-05-29 21:50:31
      又一個巨頭倒下了?虧損超62億,一代空調大王爆雷!

      又一個巨頭倒下了?虧損超62億,一代空調大王爆雷!

      素衣讀史
      2026-05-29 22:12:03
      特朗普說即將開會就伊朗戰事作出最終決定

      特朗普說即將開會就伊朗戰事作出最終決定

      新華社
      2026-05-29 23:03:15
      還敢去全季酒店過夜嗎

      還敢去全季酒店過夜嗎

      不正確
      2026-05-28 23:04:54
      5月30日,多家上市公司發布重大利好利空消息

      5月30日,多家上市公司發布重大利好利空消息

      A股數據表
      2026-05-30 06:00:06
      杰倫·威廉姆斯無緣西決搶七!G6帶傷復出狀態糟糕

      杰倫·威廉姆斯無緣西決搶七!G6帶傷復出狀態糟糕

      體壇周報
      2026-05-30 07:01:34
      為28元外賣惡意投訴騎手,985女白領已被公司開除

      為28元外賣惡意投訴騎手,985女白領已被公司開除

      不寫散文詩
      2026-05-29 12:23:12
      39歲博主“哈尼小微”突然離世,親屬:被蟲咬后感染,此前多日吃不下飯

      39歲博主“哈尼小微”突然離世,親屬:被蟲咬后感染,此前多日吃不下飯

      極目新聞
      2026-05-29 16:01:58
      新加坡香會取消了中國專場!李顯龍沒料到,這次中方不陪他們玩了

      新加坡香會取消了中國專場!李顯龍沒料到,這次中方不陪他們玩了

      影孖看世界
      2026-05-29 23:54:06
      曹操撩寡婦說的金句,如今成約會開場白,男人常掛在嘴邊

      曹操撩寡婦說的金句,如今成約會開場白,男人常掛在嘴邊

      小豫講故事
      2026-05-29 06:00:19
      釋永信被判24年后表示認命不上訴,51歲的他晚年只能在牢獄中度過

      釋永信被判24年后表示認命不上訴,51歲的他晚年只能在牢獄中度過

      映射生活的身影
      2026-05-29 19:49:24
      家宴上老婆宣布供弟弟出國,全家歡呼,我平靜開口:你月薪4800

      家宴上老婆宣布供弟弟出國,全家歡呼,我平靜開口:你月薪4800

      匹夫來搞笑
      2026-05-30 00:28:39
      百草枯發明者李德軍現狀:女兒喝百草枯喪命,70歲仍不斷救人贖罪

      百草枯發明者李德軍現狀:女兒喝百草枯喪命,70歲仍不斷救人贖罪

      天天熱點見聞
      2026-05-30 06:50:00
      襄陽割四賠五糾紛結局!訛人大媽被兩次約談,向農機手退款并道歉

      襄陽割四賠五糾紛結局!訛人大媽被兩次約談,向農機手退款并道歉

      垛垛糖
      2026-05-29 12:19:10
      有中國公民在菲被羈押期間不幸離世、監獄條件被指惡劣,中國駐菲律賓大使館核實反饋

      有中國公民在菲被羈押期間不幸離世、監獄條件被指惡劣,中國駐菲律賓大使館核實反饋

      界面新聞
      2026-05-29 23:21:07
      2026-05-30 09:19:00
      NEXT趨勢 incentive-icons
      NEXT趨勢
      新觀察、新引擎、新玩法
      272文章數 383關注度
      往期回顧 全部

      科技要聞

      Claude Opus 4.8凌晨突發上線

      頭條要聞

      "莫氏雞煲"店主老莫:靠流量還清欠債 計劃3年后退休

      頭條要聞

      "莫氏雞煲"店主老莫:靠流量還清欠債 計劃3年后退休

      體育要聞

      即使是文班亞馬,也做不到這件事

      娛樂要聞

      奚夢瑤何猷君將于6月在法國舉行婚禮

      財經要聞

      雙匯管不住一頭豬

      汽車要聞

      900V+3.2秒破百 領克10+&領克10上市16.99萬元起

      態度原創

      藝術
      旅游
      游戲
      公開課
      軍事航空

      藝術要聞

      粉墻黛瓦別樣美

      旅游要聞

      重慶:望鄉臺瀑布進入最佳觀賞期

      Sky&Infi領銜參賽!2026 GG全能王賽重磅開啟,7月線下決戰

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      中方公布參加香會陣容 幾大議題受到關注

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产在线精品一区二区中文| 97精品国产手机| 色悠久久久久综合欧美99| 国产精品高清视亚洲中文| 一本色道久久综合狠狠躁| 国产在线视频色综合| 亚洲综合久久久| 一二三三免费观看视频| 国产AV大全| 亚洲av日韩av综合aⅴxxx| 亚洲精品色情aⅴ色戒| 国产精品久久自在自线不卡| 中文字幕Aⅴ人妻一区二区苍井空| 宅男aV一区二区三区| 香蕉视频在线观看免费国产婷婷 | 日本三级黄| 无码h黄肉3d动漫在线观看| 亚洲国产午夜理论片不卡| 日韩影片一区二区三区| 蓝莓5秒跳转隐藏通道2025| 中文有无人妻VS无码人妻激烈| 亚洲国产精品综合久久20| 自拍偷拍网| 欧美精品人妻| 9191精品国产观看| 国产高清一区二区三区视频| 一区二区三区av天堂| 国产AⅤ| 亚洲成A人片在线观看WWW| 蜜桃av噜噜一区二区三区| 国内久久人妻风流av免费| 美腿丝袜中文字幕精品| 亚洲成av人无码| 国产乱人伦偷精品视频色欲| 久久精品免视看国产成人| 亚洲成人综合网站| 国产精品丝袜在线不卡| 色哟哟www网站入口成人学校| 亚洲av专区一区| 熟女丝袜潮喷内裤视频网站| 人妻无码一区二区三区免费 |