<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      硅谷深陷算力荒:H200一夜?jié)q價30%,H100搶到缺貨,Karpathy也未能幸免

      0
      分享至


      作者 | 四月

      2026 年 5 月的硅谷,對于 AI 算力的“饑荒”和焦慮,正達到一個前所未有的高度。

      哪怕那些站在算力中心的人,也不得不開始為算力排隊。

      在英偉達,負責(zé)應(yīng)用深度學(xué)習(xí)研究團隊的 Bryan Catanzaro 找黃仁勛申請訓(xùn)練卡。最近大家一直抱怨卡不夠用,受限太多。

      “不好意思,那些卡已經(jīng)賣掉了”,這是老黃給出的回復(fù)。

      Catanzaro 是英偉達的大功臣。十多年前,正是他留意到,GPU 迎來了首批 AI 買家——研究員,且?guī)缀醑偪駫哓洝;谶@個洞察,老黃才下定決心把整間公司押注 AI 賽道。

      當(dāng)年幫英偉達賭對算力卡的人,現(xiàn)在卻買不到自家的 GPU 了。

      而比“賣鏟子的沒鏟子了”更戲劇性的事,還發(fā)生在谷歌。

      去年夏天,DeepMind 的研究員 Andrew Dai 判斷,視覺推理是個值得做的方向。于是向公司內(nèi)部提了一批 TPU 的資源需求。

      但申請遲遲未批。拒絕的理由,倒不是研究方向不夠好,而是項目不能為下一代的 Gemini 服務(wù)。當(dāng)時的內(nèi)部原則是,資源應(yīng)該優(yōu)先流向付費客戶和旗艦?zāi)P汀?/p>

      “在谷歌內(nèi)部,每一塊 TPU 的背后,都有三位競爭者”,華盛頓大學(xué)計算機系的榮譽教授 Oren Etzioni 聊到。現(xiàn)實很殘酷,如果你的項目不能直接帶來收入,你就是在和付費客戶搶資源。

      Dai 最終選擇離職創(chuàng)業(yè)。和他做出同樣選擇的,還有 Anna Goldie。

      有趣的是,谷歌用來挽留 Goldie 的籌碼不是加薪,也不是期權(quán),而是——更多的 TPU 算力卡。

      但 Goldie 還是走了,還拿到了 3.35 億美元的融資,“這筆錢能買到的算力,和當(dāng)初 DeepMind 挽留我開出的條件,幾乎相當(dāng)。”

      當(dāng)大廠圍墻內(nèi)的算力變成一種“組織權(quán)限”,出走就成了唯一解。

      而在圍墻之外,獨立開發(fā)者和研究員面對的,是比“GPU 短缺”更難的處境:連卡都租不到。

      這事已經(jīng)迫切到什么程度了呢?


      這兩天,AI 大神 Andrej Karpathy 都忍不住發(fā)帖吐槽。他表示,在錄制 nanochat 教學(xué)視頻時,才突然意識到,如果實驗的第一步是,讓學(xué)員“從云平臺啟動一臺 8×H100 的服務(wù)器”,那么絕大部分人將倒在起跑線上。

      有大神出來喊話,評論區(qū)迅速變成大型比慘現(xiàn)場。

      H100 搶不到,H200 一夜?jié)q價 30%


      看這話問得,顯然是我方友軍無疑了。


      有人補刀,其實真正的第一步,還不是啟動 Server,而是求爺爺告奶奶等 quota approval。 現(xiàn)在大多數(shù)的普通用戶,是連 8×H100 的預(yù)審批權(quán)限都沒有的。




      更有開發(fā)者直接曬后臺截圖:RunPod 上多種 GPU 型號顯示 unavailable;Azure 上 H100 虛擬機啟動失敗,提示 capacity 不足;Google Colab 選擇 GPU 后,被系統(tǒng)自動降檔到 G4。


      Rohan Bansal 看著賬戶里僅存的兩個 H100 實例,發(fā)了條推文:“holding on for dear life”。

      如果說資源緊缺必然導(dǎo)致價格上漲,尚可理解。但這漲價的姿勢未免也有些詭異。

      正常的邏輯是,新一代出來,舊款降價。B200 已經(jīng)穩(wěn)定供貨,四年前的 H100 也理應(yīng)降價。


      但 SemiAnalysis 數(shù)據(jù)顯示,H100 一年期的合約租金,半年漲了近 40%(從 2025 年 10 月的 $1.70/ 小時,漲到 2026 年 3 月的 $2.35)。


      現(xiàn)貨市場更夸張,lambda 的報價已上浮到 4 美元 +/ 小時,是兩年前的兩倍。而 H200 的現(xiàn)貨價格甚至比新一代 B200 還要貴。"這價格是兩年前的兩倍還多,而且通常很難搶到,要寫腳本盯著 API 才有機會。"


      圖注:從 4.96 美元 / 小時漲到 6.40 美元 / 小時,漲幅 29%;而更新一代的 B200 為 5.68 美元 /GPU 小時。

      5% 的利用率和 B200 的倒掛

      一邊是高端 GPU 緊缺,一邊卻是算力中心里的利用率低得令人發(fā)指。

      Cast AI 的報告顯示,不少大企業(yè) GPU 集群的平均利用率只有 5% 左右。此前,馬斯克的兆瓦級算力中心 Colossus 的 MFU(模型算力利用率)僅為 11% 左右。

      其實并不是企業(yè)意識到不到算力資源的浪費,而是不敢放手。

      排隊幾個月,云廠商銷售突然打電話:“你要的卡現(xiàn)在只剩 36 張了,只能簽一年的長約。不要的話,后面還有五家排隊等著呢。”

      這時候,問題已經(jīng)不是“公司是否需要租用這么長時間的芯片”,而是“我敢不敢錯過這筆訂單”。

      先簽下來,哪怕閑置也不釋放,因為交出去的算力卡可能就再也拿不回來了。

      芯片不只是產(chǎn)能短缺,更是流動性短缺:它卡在企業(yè)的算力長約里,困在云廠商的容量池里,但就是不在普通開發(fā)者今晚能點開購買的頁面上。

      短缺制造恐慌,恐慌制造囤積,囤積制造更深的短缺。

      而這種流動性的枯竭,也放大了另一個結(jié)構(gòu)性問題:為什么偏偏是 H100/H200 被推上了天價,甚至比新一代 B200 還貴?

      因為算力市場從來不是按“誰更新”來定價,而是按“誰更好用、更好接入”來定價的。

      過去大家搶 GPU,想象中的場景是巨頭訓(xùn)練下一代大模型,當(dāng)然要追求極致先進。但現(xiàn)在,消耗 GPU 的地方變多了:推理服務(wù)、代碼 Agent、RL 后訓(xùn)練、自動評測、小模型復(fù)現(xiàn)、教學(xué)實驗,都在持續(xù)吃算力。

      對于這些海量需求來說,B200 代表的下一代性能上限并不是首選。

      做工程的人最懂:最先進不等于最好用,真正值錢的是確定性。

      H100/H200 足夠強,且生態(tài)足夠成熟。你用 H100 跑,別人的 benchmark 也是 H100;你用 H200 做推理,調(diào)參經(jīng)驗已經(jīng)有人踩過坑。

      相比之下,新一代芯片再強,也需要時間消化到框架、集群、調(diào)度和成本模型里。

      訓(xùn)練市場還沒完全切到 Blackwell,推理和后訓(xùn)練市場又把需求重重疊加上來。舊卡本該退場,卻因為“確定性”成了剛需。

      AI 民主化,卡在了算力門檻上

      這一輪的芯片荒,和過去還不太一樣。

      過去聊缺芯,是頂級 AI Lab 的軍備競賽,巨頭誰搶到更多 GPU,誰就能訓(xùn)練更大模型。但這一次,焦慮正在往下沉。

      Karpathy 錄教程要先考慮開發(fā)者能不能拿到 8×H100;LocalLLaMA 社區(qū)討論能不能用本地 Mac 硬跑;高校研究員擔(dān)心拿不到算力,小團隊擔(dān)心擴容被大客戶擠掉。

      這背后已經(jīng)不是“我要訓(xùn)練 GPT-5”的野心,而是一個更樸素的問題:我只是想復(fù)現(xiàn)一個實驗,為什么第一步就變成搶算力了?

      AI 開源這幾年確實降低了許多門檻。模型權(quán)重可以下載,代碼可以 fork。但算力把另一扇門關(guān)上了。

      代碼可以開源,但 H100 不能 fork。

      真正的 AI 研究從來不只是看懂代碼,還得你能跑通實驗、復(fù)現(xiàn)結(jié)果,調(diào)參、失敗,以及很多次的再重來。

      如果每次實驗的前提,都是拿到一組昂貴且不穩(wěn)定的 GPU,那么開源的平等,就會被算力的不平等重新抵消。

      從 Google 研究員離職創(chuàng)業(yè),到英偉達內(nèi)部爭 GPU,然后是 Karpathy 的教學(xué)視頻卡在 8 張 H100,它們指向同一件事:算力正在從基礎(chǔ)設(shè)施,變成一種篩選機制。

      它篩掉的未必是沒有想法的人,而是沒有預(yù)算、沒有配額資源、沒有長期合同的群體。

      這才是 AI 民主化最尷尬的現(xiàn)實:模型越來越開放,但能跑起來的人,可能并沒有變多。

      國內(nèi)開發(fā)者的痛:過渡期的壓力

      把視線拉回國內(nèi),如果說海外開發(fā)者是在成熟生態(tài)里搶 H100/H200 現(xiàn)貨;那么國內(nèi)開發(fā)者面對的,則是過渡期的多重壓力考驗,要在新的算力結(jié)構(gòu)里找"能用且好用"的解法。

      某云 H100 排期已到 2027 年第一季度,更多的云平臺同樣面臨高端卡供應(yīng)瓶頸,"有錢也租不到"是真實的用戶反饋。

      與此同時,高端卡的獲取仍然受政策影響,當(dāng)然國產(chǎn)算力替代正在加速。但從 CUDA 體系切換的工程成本是真實存在的,適配層、代碼改動、調(diào)試周期,對小團隊而言不是輕松的遷移。

      其實,大家底層的處境不盡相同。算力底座從來不是一個宏大詞,而是非常具體的體驗——實例能不能啟動,價格扛不扛得住,實驗結(jié)果能不能復(fù)現(xiàn)。

      今天 AI 圈真正稀缺的,也許不是最新的芯片,而是普通人能穩(wěn)定拿到、馬上用起來、跑出結(jié)果的有效算力。

      1. Even Nvidia’s own research teams can’t get enough GPUs amid the race for AI computing power(https://fortune.com/2026/04/09/nvidia-gpu-shortage-impacts-even-nvidias-own-research-teams-bryan-catanzaro-eye-on-ai/)

      2. The Great GPU Shortage – Rental Capacity – Launching our H100 1 Year Rental Price Index(https://newsletter.semianalysis.com/p/the-great-gpu-shortage-rental-capacity)

      3. FOMO is why enterprises pay for GPUs they don't use — and why prices keep climbing(https://venturebeat.com/infrastructure/fomo-is-why-enterprises-pay-for-gpus-they-dont-use-and-why-prices-keep-climbing)

      4. https://semianalysis.com/gpu-pricing-index/

      5. Nvidia A100 vs H100 vs B200 GPU Rental Price and Performance(https://ornn.com/insights/nvidia-a100-vs-h100-vs-b200-gpu-rental-price-and-performance)

      聲明:本文為 AI 前線原創(chuàng),不代表平臺觀點,未經(jīng)許可禁止轉(zhuǎn)載。

      會議推薦

      Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發(fā)體系不重構(gòu),還能撐多久?

      AICon 上海站 2026,13 大重磅專題已上線,誠摯邀請你登臺分享實戰(zhàn)經(jīng)驗。AICon 2026,期待與你同行。快來掃碼鎖定 8 折專屬席位或提交演講議題

      今日薦文

      你也「在看」嗎?

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      黃仁勛送飲料給一個女生,為什么連問了兩次人家:你喜歡養(yǎng)樂多嗎

      黃仁勛送飲料給一個女生,為什么連問了兩次人家:你喜歡養(yǎng)樂多嗎

      西樓知趣雜談
      2026-05-19 06:57:24
      烈性犬咬死2歲女童,狗主人毛某義犯過失致人死亡罪,獲刑三年緩刑四年,賠償25萬元,為避免再次傷人,案發(fā)后該狗被警方無公害處理

      烈性犬咬死2歲女童,狗主人毛某義犯過失致人死亡罪,獲刑三年緩刑四年,賠償25萬元,為避免再次傷人,案發(fā)后該狗被警方無公害處理

      大風(fēng)新聞
      2026-05-20 11:34:00
      籃協(xié)對內(nèi)蒙古女籃開出大罰單:罰款100萬,2人終身禁賽,收回亞軍

      籃協(xié)對內(nèi)蒙古女籃開出大罰單:罰款100萬,2人終身禁賽,收回亞軍

      體育哲人
      2026-05-20 11:56:31
      挺進決賽!U17國足2比0完勝澳大利亞,將與日本隊爭冠!

      挺進決賽!U17國足2比0完勝澳大利亞,將與日本隊爭冠!

      足球報
      2026-05-20 04:30:59
      普京來華不到24小時,美歐果然憋不住,聯(lián)手對中國揮出一記重拳

      普京來華不到24小時,美歐果然憋不住,聯(lián)手對中國揮出一記重拳

      知法而形
      2026-05-20 11:42:25
      誰錯了?曹暉坐在馬斯克身邊,幾乎沒有與馬斯克交流,被網(wǎng)友笑話

      誰錯了?曹暉坐在馬斯克身邊,幾乎沒有與馬斯克交流,被網(wǎng)友笑話

      蝴蝶花雨話教育
      2026-05-20 00:05:10
      這么快就打臉了…

      這么快就打臉了…

      子說一點
      2026-05-19 18:25:04
      票房從31億跌到663萬,我感慨《給阿嬤的情書》又加劇了影視寒冬

      票房從31億跌到663萬,我感慨《給阿嬤的情書》又加劇了影視寒冬

      娛樂故事
      2026-05-19 11:34:10
      山西一位14歲女孩被活生生配冥婚,警察找到時發(fā)現(xiàn),已與死者合葬

      山西一位14歲女孩被活生生配冥婚,警察找到時發(fā)現(xiàn),已與死者合葬

      莫地方
      2026-05-20 01:40:03
      樊同學(xué)父親身份疑似曝光,5000元獎金都是她父親出的?扣4500沒錯

      樊同學(xué)父親身份疑似曝光,5000元獎金都是她父親出的?扣4500沒錯

      千言娛樂記
      2026-05-20 11:18:26
      人山人海,阿森納球迷涌上倫敦街頭慶祝球隊時隔22年重奪英超

      人山人海,阿森納球迷涌上倫敦街頭慶祝球隊時隔22年重奪英超

      懂球帝
      2026-05-20 06:03:08
      讓9男共用廁所,方媛人設(shè)翻車!發(fā)文秒刪被罵,郭富城也救不了

      讓9男共用廁所,方媛人設(shè)翻車!發(fā)文秒刪被罵,郭富城也救不了

      頭號電影院
      2026-05-19 11:59:49
      連日本人都看不下去!高市早苗一把搶過李在明的眼鏡戴在自己臉上

      連日本人都看不下去!高市早苗一把搶過李在明的眼鏡戴在自己臉上

      阿龍聊軍事
      2026-05-20 11:49:22
      中國GDP全球排名第二,但居民消費率倒數(shù)第三,2023年僅39.6%。所以,錢都去哪了?

      中國GDP全球排名第二,但居民消費率倒數(shù)第三,2023年僅39.6%。所以,錢都去哪了?

      六子吃涼粉
      2026-05-20 11:27:44
      網(wǎng)傳最高人民法院回函:基于性取向、性別認(rèn)同或性別表達的不合理歧視均屬違法行為

      網(wǎng)傳最高人民法院回函:基于性取向、性別認(rèn)同或性別表達的不合理歧視均屬違法行為

      三言四拍
      2026-05-20 11:52:48
      上海市文旅局日前公告上海居民可申請赴金馬旅游,國臺辦:臺灣有關(guān)方面應(yīng)順應(yīng)民意,正視島內(nèi)旅游業(yè)界和民眾的呼聲,盡快解除不合理禁限

      上海市文旅局日前公告上海居民可申請赴金馬旅游,國臺辦:臺灣有關(guān)方面應(yīng)順應(yīng)民意,正視島內(nèi)旅游業(yè)界和民眾的呼聲,盡快解除不合理禁限

      極目新聞
      2026-05-20 10:51:37
      女人一旦有了兩個男人,這輩子注定不得安寧

      女人一旦有了兩個男人,這輩子注定不得安寧

      加油丁小文
      2026-05-20 08:30:06
      近億元銀磚運輸途中遺失13塊:神秘人交還12塊領(lǐng)走23.5萬元賞金,司機身背39萬元債務(wù),仍在苦尋最后一塊

      近億元銀磚運輸途中遺失13塊:神秘人交還12塊領(lǐng)走23.5萬元賞金,司機身背39萬元債務(wù),仍在苦尋最后一塊

      大風(fēng)新聞
      2026-05-20 10:43:30
      山東山姆開業(yè)后亂象頻發(fā),有人店里吃完再把包裝盒丟掉

      山東山姆開業(yè)后亂象頻發(fā),有人店里吃完再把包裝盒丟掉

      映射生活的身影
      2026-05-19 20:24:13
      憤怒沖腦!上海第二工業(yè)大學(xué)男生課堂喊殺:起因曝光,當(dāng)事人發(fā)聲

      憤怒沖腦!上海第二工業(yè)大學(xué)男生課堂喊殺:起因曝光,當(dāng)事人發(fā)聲

      李晚書
      2026-05-20 08:39:29
      2026-05-20 13:28:49
      AI前線 incentive-icons
      AI前線
      面向AI愛好者、開發(fā)者和科學(xué)家,提供AI領(lǐng)域技術(shù)資訊。
      1509文章數(shù) 149關(guān)注度
      往期回顧 全部

      科技要聞

      一文看懂谷歌I/O2026:谷歌打響智能體大戰(zhàn)

      頭條要聞

      烈性犬咬死2歲女童狗主人賠25萬 狗被警方無公害處理

      頭條要聞

      烈性犬咬死2歲女童狗主人賠25萬 狗被警方無公害處理

      體育要聞

      不再美麗的阿森納,終于成為英超冠軍

      娛樂要聞

      舒淇大方承認(rèn):卸了妝就是50 歲的模樣

      財經(jīng)要聞

      白酒榜|汾酒營收凈利雙增 口子窖"造富"

      汽車要聞

      煥新極氪009上市41.38萬起 齊家版讓MPV回歸家庭

      態(tài)度原創(chuàng)

      家居
      藝術(shù)
      時尚
      親子
      公開課

      家居要聞

      日常印記 靜謐溫馨

      藝術(shù)要聞

      18幅 玫瑰花與女子畫作

      為了攻克漸凍癥,她把自己活成了“破冰”的人

      親子要聞

      “消”字號當(dāng)“妝”字號賣?“毒面霜”悲劇還在對著兒童......

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: japanese边做边乳喷| 99久久免费精品色老| 久久亚洲精精品中文字幕| 日韩av一区二区精品不卡| 开心五月婷婷综合网站| 欧美性大战久久久久久久蜜桃| 国产欧美va欧美va在线| 成人午夜av在线播放| 人人操网| 一区二区在线 | 欧洲| 国产无套专区精品一区| 在线精品无码字幕无码AV| 亚洲va中文字幕无码久久不卡| 日韩中文字幕综合第二页| 老王av| 国产内射性高湖| 色午夜av男人的天堂| 97精品国产高清久久久久蜜芽| 国产精品久线在线观看| 亚洲av中文乱码一区二| 亚洲免费成人av一区| 国产成人一区二区三区| 平度市| 人妻免费一区二区三区最新| 欧美性猛交xxxx乱大交丰满| 少妇人妻偷人精品系列| 亚洲粉嫩av一区二区黑人| 亚洲欧洲日产国码无码av野外| 精品日韩人妻| AV黄色网址| 伊人五月久久1区| 一区二区三区鲁丝不卡| 日韩av在线一区二区三区| 美女成人网站| 亚洲高清aⅴ日本欧美视频| 国产精品自拍超碰在线| 亚洲av无码成人专区| jizzjizz日本高潮喷水| 国产精品福利在线观看无码卡一| 视频一区视频二区视频三 | 国产在线视频www色|