SemiAnalysis：下游大模型公司已經(jīng)爆賺，英偉達(dá)、臺積電還能賺更多

2026-05-02 12:13:10　來源: 華爾街見聞官方

上海舉報(bào)

分享至

AI價(jià)值鏈正在經(jīng)歷結(jié)構(gòu)性重估。過去賺走大部分利潤的芯片制造商正面臨下游模型廠商的快速追趕，但上游的利潤空間遠(yuǎn)未觸及天花板。

SemiAnalysis分析指出，Anthropic年化收入在數(shù)月內(nèi)從90億美元升至逾440億美元，推理毛利率從38%增至70%以上。英偉達(dá)目前的定價(jià)框架仍以成本為導(dǎo)向，尚未反映推理工作負(fù)載經(jīng)濟(jì)學(xué)的變化。一旦框架調(diào)整，英偉達(dá)系統(tǒng)定價(jià)具備40%以上的上調(diào)空間。臺積電N3制程產(chǎn)能同樣處于價(jià)值重分配的核心位置。

支撐此判斷的關(guān)鍵在于供需兩端的結(jié)構(gòu)性錯(cuò)配：N3制程預(yù)計(jì)2026年下半年利用率將超過100%，DRAM工廠已逾90%滿負(fù)荷運(yùn)行，而前沿模型的Token需求仍在以復(fù)合速度擴(kuò)張。這一背景下，英偉達(dá)通過SOCAMM內(nèi)存模塊實(shí)現(xiàn)差異化定價(jià)的窗口已經(jīng)打開。

AI價(jià)值洼地轉(zhuǎn)移：基礎(chǔ)設(shè)施層讓位于模型層

從2023年至2025年初，AI價(jià)值鏈中的絕大部分利潤積聚于基礎(chǔ)設(shè)施層。英偉達(dá)率先爆發(fā)，隨后電力資產(chǎn)Vistra與GE Vernova分別在2024年上漲265%和146%，存儲廠商SanDisk、Western Digital、Seagate和Micron在2025年均實(shí)現(xiàn)逾200%漲幅。

這一格局的背面，是模型創(chuàng)建者與推理服務(wù)商長期承受的低毛利困境。彼時(shí)AI的實(shí)際使用價(jià)值有限，市場對AI投資回報(bào)的質(zhì)疑聲不斷。

轉(zhuǎn)折點(diǎn)出現(xiàn)在2025年12月。隨著Agentic AI（智能體AI）真正走向?qū)嵱茫珹I的經(jīng)濟(jì)邏輯被徹底改寫。SemiAnalysis披露，其自身年化Token消耗支出已接近員工薪酬的30%，每名員工每月消耗Token量接近50億個(gè)，是Meta內(nèi)部人均用量的5倍以上。大量原本需要初級分析師數(shù)小時(shí)完成的工作——包括財(cái)務(wù)建模、數(shù)據(jù)可視化、盈利分析——如今只需數(shù)美元的Token支出即可完成。

SemiAnalysis估算，其團(tuán)隊(duì)在Anthropic Claude上的年化支出峰值已達(dá)1095萬美元，而由此帶來的競爭優(yōu)勢遠(yuǎn)超這一成本。Anthropic隨即受益：ARR從90億美元飆升至440億美元以上，推理毛利率從38%升至超過70%。

Token成本驟降，模型廠商利潤率擴(kuò)張具有持續(xù)性

驅(qū)動(dòng)模型廠商毛利率躍升的另一核心因素，是Token生產(chǎn)成本的大幅下降。

從硬件維度看，在8K輸入、1K輸出的標(biāo)準(zhǔn)推理任務(wù)上，經(jīng)過完整軟件優(yōu)化（含寬EP、計(jì)算與預(yù)取分離、多令牌預(yù)測）的B300系統(tǒng)每秒每GPU可產(chǎn)生約14000個(gè)Token，而未優(yōu)化版本僅約1000個(gè)——同款硬件上，軟件優(yōu)化單獨(dú)貢獻(xiàn)了14倍的吞吐量提升。若進(jìn)一步疊加硬件升級，最優(yōu)配置的GB300 NVL72相比H100的FP8吞吐量提升約17倍，切換至H100原生不支持的FP4精度后，差距擴(kuò)大至32倍，而GB300每GPU總擁有成本僅高出約70%。

從定價(jià)結(jié)構(gòu)看，Agentic工作負(fù)載具有極高的輸入輸出比（Claude Code使用場景約為300:1）與極高的緩存命中率（90%以上），使得絕大多數(shù)Token落入最低計(jì)費(fèi)檔。SemiAnalysis估算，Opus 4.7在智能體任務(wù)上的真實(shí)混合成本約為每百萬Token0.99美元，遠(yuǎn)低于標(biāo)價(jià)的每百萬輸入Token5美元。

即便面對Anthropic對Opus系列的大幅降價(jià)——Opus 4.5的定價(jià)較此前降低三分之二——SemiAnalysis認(rèn)為Anthropic的單位毛利實(shí)際上有所提升：一方面，生產(chǎn)成本隨硬件升級進(jìn)一步下降；另一方面，用戶大規(guī)模從Sonnet切換至Opus，推高了混合ASP。

更具戰(zhàn)略意義的是，Anthropic在高端產(chǎn)品線上仍擁有定價(jià)主導(dǎo)權(quán)。Opus Fast定價(jià)為常規(guī)Opus的6倍，而已宣布的Mythos定價(jià)為每百萬Token25美元/125美元，是常規(guī)Opus的5倍。SemiAnalysis明確表示，若Anthropic愿意開放每百萬Token150美元/750美元的Mythos Fast，其團(tuán)隊(duì)仍會(huì)購買——因?yàn)樯a(chǎn)力提升的價(jià)值遠(yuǎn)超成本。

模型廠商的定價(jià)權(quán)為何難以被競爭侵蝕

對于前沿模型高利潤率是否可持續(xù)，最常見的質(zhì)疑來自競爭壓力。SemiAnalysis給出了兩個(gè)反駁理由。

其一，前沿閉源模型與開源模型之間的能力差距依然顯著，且短期內(nèi)難以彌合。以Kimi K2.6（每百萬Token0.95美元/4美元）為代表的低價(jià)開源模型對Opus定價(jià)幾乎不構(gòu)成實(shí)質(zhì)性壓制。

其二，算力約束意味著任何一家前沿實(shí)驗(yàn)室都無法獨(dú)自服務(wù)整個(gè)市場。Anthropic已通過將Claude Code鎖定在100美元以上月訂閱門檻、限制第三方接入等方式主動(dòng)管理需求側(cè)。Token需求在可預(yù)見的未來將持續(xù)超出供給，這意味著有能力提供真正前沿質(zhì)量的實(shí)驗(yàn)室，可以按照Token所創(chuàng)造的經(jīng)濟(jì)價(jià)值而非競爭性成本來制定價(jià)格。

英偉達(dá)的定價(jià)克制：監(jiān)管邏輯還是戰(zhàn)略誤判

面對AI價(jià)值鏈的深刻重構(gòu)，英偉達(dá)迄今未對其定價(jià)框架作出實(shí)質(zhì)性調(diào)整，這是一個(gè)值得關(guān)注的結(jié)構(gòu)性問題。

英偉達(dá)目前的定價(jià)仍主要以成本為錨，反映的是需求價(jià)值隨時(shí)間遞減的舊范式——而這一假設(shè)已不再成立。當(dāng)前需求增長并非線性，而是以復(fù)合速度擴(kuò)張，由智能體工作負(fù)載爆發(fā)與每個(gè)工作流程Token消耗量的持續(xù)躍升共同驅(qū)動(dòng)。

SemiAnalysis認(rèn)為，英偉達(dá)保持定價(jià)克制，部分原因在于監(jiān)管層面的顧慮。英偉達(dá)在GPU、互聯(lián)與軟件棧上的主導(dǎo)地位已引發(fā)日益密切的反壟斷關(guān)注。在下游AI實(shí)驗(yàn)室同樣大幅盈利的背景下，激進(jìn)提價(jià)可能加劇監(jiān)管風(fēng)險(xiǎn)，也可能加速客戶向TPU、Trainium等替代平臺分散。

在此意義上，英偉達(dá)的行為模式與臺積電頗為相似。臺積電長期以來即便在滿負(fù)荷運(yùn)營、扮演先進(jìn)制程供應(yīng)瓶頸的情況下，也未將定價(jià)提升至稀缺溢價(jià)的極限，而是優(yōu)先維護(hù)生態(tài)系統(tǒng)長期穩(wěn)定與客戶關(guān)系。這一邏輯可概括為"AI央行"——通過適度讓利支撐下游生態(tài)擴(kuò)張，而非最大化短期利潤提取，以確保自身在AI時(shí)代的長期主導(dǎo)地位。

然而，這一策略存在真實(shí)的機(jī)會(huì)成本。在算力需求持續(xù)超過供給的結(jié)構(gòu)性背景下，掌握稀缺資源卻未充分定價(jià)，相當(dāng)于將價(jià)值拱手相讓給生態(tài)鏈中游和下游。臺積電在N3制程上同樣如此——SemiAnalysis直接指出這是"戰(zhàn)略失誤"，至少應(yīng)要求更大規(guī)模的預(yù)付款安排。

Rubin定價(jià)空間：SOCAMM成為利潤新杠桿

英偉達(dá)即將推出的Vera Rubin VR NVL72系統(tǒng)，提供了一個(gè)重新評估定價(jià)框架的契機(jī)。

從成本角度看，據(jù)測算，VR NVL72實(shí)現(xiàn)與GB300 NVL72相同的15.6%項(xiàng)目IRR（5年期，15%預(yù)付款）所需的最低GPU租金約為每小時(shí)4.92美元。從價(jià)值角度看，若以FP8密集算力維度錨定當(dāng)前GB300每PFLOP租金約0.70美元，VR NVL72對應(yīng)的理論最高定價(jià)約為每GPU每小時(shí)12.25美元，是成本地板價(jià)的約2.5倍。

這一巨大價(jià)差表明，英偉達(dá)在VR NVL72定價(jià)上擁有充足的上調(diào)空間。SemiAnalysis估算，若英偉達(dá)將系統(tǒng)定價(jià)提升約40%，仍可為Neocloud保留足夠的利潤空間——即便Neocloud將租金提價(jià)至每小時(shí)8美元以上，對應(yīng)每PFLOP成本仍低于歷史趨勢線。

在具體機(jī)制上，SOCAMM成為最關(guān)鍵的定價(jià)杠桿。不同于GB300將LPDDR5X內(nèi)存直接焊接于主板、嵌入整體系統(tǒng)定價(jià)，VR NVL72采用可插拔的SOCAMM模塊，允許英偉達(dá)將內(nèi)存作為獨(dú)立計(jì)費(fèi)項(xiàng)目單獨(dú)列示和定價(jià)。

SOCAMM（Small Outline Compression Attached Memory Module，小型化壓縮附加內(nèi)存模組）是英偉達(dá)主導(dǎo)、聯(lián)合三星、SK海力士和美光等內(nèi)存廠商開發(fā)的新型模塊化內(nèi)存標(biāo)準(zhǔn)，基于LPDDR5X（或未來LPDDR6）DRAM技術(shù)，面向AI服務(wù)器與個(gè)人AI超級計(jì)算機(jī)場景。

模型顯示，英偉達(dá)在2026年第一季度支付的SOCAMM合同價(jià)格約為每GB 8美元，較上季度大幅提升，主要反映LPDDR5X供應(yīng)緊張與整體DRAM價(jià)格上行。基于對2026年底移動(dòng)DRAM定價(jià)的預(yù)測，2026年底SOCAMM定價(jià)或超過每GB 13美元，全年均值約10美元為合理假設(shè)。

在此基礎(chǔ)上，SemiAnalysis認(rèn)為英偉達(dá)在SOCAMM上收取60%毛利率具有合理性：一是內(nèi)存供應(yīng)全面緊張，英偉達(dá)在SOCAMM采購上具有優(yōu)先獲取權(quán)；二是VR NVL72在性能/TCO維度遠(yuǎn)超同期競品，客戶缺乏可替代選項(xiàng)；三是英偉達(dá)本身已面臨SOCAMM采購成本的大幅上漲，向下游傳導(dǎo)具有合理依據(jù)。

此外，內(nèi)存定價(jià)不像GPU定價(jià)那樣面臨反壟斷顧慮，這給了英偉達(dá)更大的差異化定價(jià)空間——包括對Neocloud與超大規(guī)模云廠商實(shí)施差別定價(jià)。目前，英偉達(dá)在網(wǎng)絡(luò)設(shè)備上已對Neocloud收取約為超大規(guī)模云廠商兩倍的價(jià)格，同樣的邏輯完全可以延伸至內(nèi)存層面。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.