AI價(jià)值鏈正在經(jīng)歷結(jié)構(gòu)性重估。過去賺走大部分利潤的芯片制造商正面臨下游模型廠商的快速追趕,但上游的利潤空間遠(yuǎn)未觸及天花板。
SemiAnalysis分析指出,Anthropic年化收入在數(shù)月內(nèi)從90億美元升至逾440億美元,推理毛利率從38%增至70%以上。英偉達(dá)目前的定價(jià)框架仍以成本為導(dǎo)向,尚未反映推理工作負(fù)載經(jīng)濟(jì)學(xué)的變化。一旦框架調(diào)整,英偉達(dá)系統(tǒng)定價(jià)具備40%以上的上調(diào)空間。臺積電N3制程產(chǎn)能同樣處于價(jià)值重分配的核心位置。
支撐此判斷的關(guān)鍵在于供需兩端的結(jié)構(gòu)性錯(cuò)配:N3制程預(yù)計(jì)2026年下半年利用率將超過100%,DRAM工廠已逾90%滿負(fù)荷運(yùn)行,而前沿模型的Token需求仍在以復(fù)合速度擴(kuò)張。這一背景下,英偉達(dá)通過SOCAMM內(nèi)存模塊實(shí)現(xiàn)差異化定價(jià)的窗口已經(jīng)打開。
AI價(jià)值洼地轉(zhuǎn)移:基礎(chǔ)設(shè)施層讓位于模型層
從2023年至2025年初,AI價(jià)值鏈中的絕大部分利潤積聚于基礎(chǔ)設(shè)施層。英偉達(dá)率先爆發(fā),隨后電力資產(chǎn)Vistra與GE Vernova分別在2024年上漲265%和146%,存儲廠商SanDisk、Western Digital、Seagate和Micron在2025年均實(shí)現(xiàn)逾200%漲幅。
這一格局的背面,是模型創(chuàng)建者與推理服務(wù)商長期承受的低毛利困境。彼時(shí)AI的實(shí)際使用價(jià)值有限,市場對AI投資回報(bào)的質(zhì)疑聲不斷。
轉(zhuǎn)折點(diǎn)出現(xiàn)在2025年12月。隨著Agentic AI(智能體AI)真正走向?qū)嵱茫珹I的經(jīng)濟(jì)邏輯被徹底改寫。SemiAnalysis披露,其自身年化Token消耗支出已接近員工薪酬的30%,每名員工每月消耗Token量接近50億個(gè),是Meta內(nèi)部人均用量的5倍以上。大量原本需要初級分析師數(shù)小時(shí)完成的工作——包括財(cái)務(wù)建模、數(shù)據(jù)可視化、盈利分析——如今只需數(shù)美元的Token支出即可完成。
SemiAnalysis估算,其團(tuán)隊(duì)在Anthropic Claude上的年化支出峰值已達(dá)1095萬美元,而由此帶來的競爭優(yōu)勢遠(yuǎn)超這一成本。Anthropic隨即受益:ARR從90億美元飆升至440億美元以上,推理毛利率從38%升至超過70%。
Token成本驟降,模型廠商利潤率擴(kuò)張具有持續(xù)性
驅(qū)動(dòng)模型廠商毛利率躍升的另一核心因素,是Token生產(chǎn)成本的大幅下降。
從硬件維度看,在8K輸入、1K輸出的標(biāo)準(zhǔn)推理任務(wù)上,經(jīng)過完整軟件優(yōu)化(含寬EP、計(jì)算與預(yù)取分離、多令牌預(yù)測)的B300系統(tǒng)每秒每GPU可產(chǎn)生約14000個(gè)Token,而未優(yōu)化版本僅約1000個(gè)——同款硬件上,軟件優(yōu)化單獨(dú)貢獻(xiàn)了14倍的吞吐量提升。若進(jìn)一步疊加硬件升級,最優(yōu)配置的GB300 NVL72相比H100的FP8吞吐量提升約17倍,切換至H100原生不支持的FP4精度后,差距擴(kuò)大至32倍,而GB300每GPU總擁有成本僅高出約70%。
從定價(jià)結(jié)構(gòu)看,Agentic工作負(fù)載具有極高的輸入輸出比(Claude Code使用場景約為300:1)與極高的緩存命中率(90%以上),使得絕大多數(shù)Token落入最低計(jì)費(fèi)檔。SemiAnalysis估算,Opus 4.7在智能體任務(wù)上的真實(shí)混合成本約為每百萬Token0.99美元,遠(yuǎn)低于標(biāo)價(jià)的每百萬輸入Token5美元。
即便面對Anthropic對Opus系列的大幅降價(jià)——Opus 4.5的定價(jià)較此前降低三分之二——SemiAnalysis認(rèn)為Anthropic的單位毛利實(shí)際上有所提升:一方面,生產(chǎn)成本隨硬件升級進(jìn)一步下降;另一方面,用戶大規(guī)模從Sonnet切換至Opus,推高了混合ASP。
更具戰(zhàn)略意義的是,Anthropic在高端產(chǎn)品線上仍擁有定價(jià)主導(dǎo)權(quán)。Opus Fast定價(jià)為常規(guī)Opus的6倍,而已宣布的Mythos定價(jià)為每百萬Token25美元/125美元,是常規(guī)Opus的5倍。SemiAnalysis明確表示,若Anthropic愿意開放每百萬Token150美元/750美元的Mythos Fast,其團(tuán)隊(duì)仍會(huì)購買——因?yàn)樯a(chǎn)力提升的價(jià)值遠(yuǎn)超成本。
![]()
模型廠商的定價(jià)權(quán)為何難以被競爭侵蝕
對于前沿模型高利潤率是否可持續(xù),最常見的質(zhì)疑來自競爭壓力。SemiAnalysis給出了兩個(gè)反駁理由。
其一,前沿閉源模型與開源模型之間的能力差距依然顯著,且短期內(nèi)難以彌合。以Kimi K2.6(每百萬Token0.95美元/4美元)為代表的低價(jià)開源模型對Opus定價(jià)幾乎不構(gòu)成實(shí)質(zhì)性壓制。
其二,算力約束意味著任何一家前沿實(shí)驗(yàn)室都無法獨(dú)自服務(wù)整個(gè)市場。Anthropic已通過將Claude Code鎖定在100美元以上月訂閱門檻、限制第三方接入等方式主動(dòng)管理需求側(cè)。Token需求在可預(yù)見的未來將持續(xù)超出供給,這意味著有能力提供真正前沿質(zhì)量的實(shí)驗(yàn)室,可以按照Token所創(chuàng)造的經(jīng)濟(jì)價(jià)值而非競爭性成本來制定價(jià)格。
英偉達(dá)的定價(jià)克制:監(jiān)管邏輯還是戰(zhàn)略誤判
面對AI價(jià)值鏈的深刻重構(gòu),英偉達(dá)迄今未對其定價(jià)框架作出實(shí)質(zhì)性調(diào)整,這是一個(gè)值得關(guān)注的結(jié)構(gòu)性問題。
英偉達(dá)目前的定價(jià)仍主要以成本為錨,反映的是需求價(jià)值隨時(shí)間遞減的舊范式——而這一假設(shè)已不再成立。當(dāng)前需求增長并非線性,而是以復(fù)合速度擴(kuò)張,由智能體工作負(fù)載爆發(fā)與每個(gè)工作流程Token消耗量的持續(xù)躍升共同驅(qū)動(dòng)。
SemiAnalysis認(rèn)為,英偉達(dá)保持定價(jià)克制,部分原因在于監(jiān)管層面的顧慮。英偉達(dá)在GPU、互聯(lián)與軟件棧上的主導(dǎo)地位已引發(fā)日益密切的反壟斷關(guān)注。在下游AI實(shí)驗(yàn)室同樣大幅盈利的背景下,激進(jìn)提價(jià)可能加劇監(jiān)管風(fēng)險(xiǎn),也可能加速客戶向TPU、Trainium等替代平臺分散。
在此意義上,英偉達(dá)的行為模式與臺積電頗為相似。臺積電長期以來即便在滿負(fù)荷運(yùn)營、扮演先進(jìn)制程供應(yīng)瓶頸的情況下,也未將定價(jià)提升至稀缺溢價(jià)的極限,而是優(yōu)先維護(hù)生態(tài)系統(tǒng)長期穩(wěn)定與客戶關(guān)系。這一邏輯可概括為"AI央行"——通過適度讓利支撐下游生態(tài)擴(kuò)張,而非最大化短期利潤提取,以確保自身在AI時(shí)代的長期主導(dǎo)地位。
然而,這一策略存在真實(shí)的機(jī)會(huì)成本。在算力需求持續(xù)超過供給的結(jié)構(gòu)性背景下,掌握稀缺資源卻未充分定價(jià),相當(dāng)于將價(jià)值拱手相讓給生態(tài)鏈中游和下游。臺積電在N3制程上同樣如此——SemiAnalysis直接指出這是"戰(zhàn)略失誤",至少應(yīng)要求更大規(guī)模的預(yù)付款安排。
Rubin定價(jià)空間:SOCAMM成為利潤新杠桿
英偉達(dá)即將推出的Vera Rubin VR NVL72系統(tǒng),提供了一個(gè)重新評估定價(jià)框架的契機(jī)。
從成本角度看,據(jù)測算,VR NVL72實(shí)現(xiàn)與GB300 NVL72相同的15.6%項(xiàng)目IRR(5年期,15%預(yù)付款)所需的最低GPU租金約為每小時(shí)4.92美元。從價(jià)值角度看,若以FP8密集算力維度錨定當(dāng)前GB300每PFLOP租金約0.70美元,VR NVL72對應(yīng)的理論最高定價(jià)約為每GPU每小時(shí)12.25美元,是成本地板價(jià)的約2.5倍。
這一巨大價(jià)差表明,英偉達(dá)在VR NVL72定價(jià)上擁有充足的上調(diào)空間。SemiAnalysis估算,若英偉達(dá)將系統(tǒng)定價(jià)提升約40%,仍可為Neocloud保留足夠的利潤空間——即便Neocloud將租金提價(jià)至每小時(shí)8美元以上,對應(yīng)每PFLOP成本仍低于歷史趨勢線。
在具體機(jī)制上,SOCAMM成為最關(guān)鍵的定價(jià)杠桿。不同于GB300將LPDDR5X內(nèi)存直接焊接于主板、嵌入整體系統(tǒng)定價(jià),VR NVL72采用可插拔的SOCAMM模塊,允許英偉達(dá)將內(nèi)存作為獨(dú)立計(jì)費(fèi)項(xiàng)目單獨(dú)列示和定價(jià)。
SOCAMM(Small Outline Compression Attached Memory Module,小型化壓縮附加內(nèi)存模組)是英偉達(dá)主導(dǎo)、聯(lián)合三星、SK海力士和美光等內(nèi)存廠商開發(fā)的新型模塊化內(nèi)存標(biāo)準(zhǔn),基于LPDDR5X(或未來LPDDR6)DRAM技術(shù),面向AI服務(wù)器與個(gè)人AI超級計(jì)算機(jī)場景。
模型顯示,英偉達(dá)在2026年第一季度支付的SOCAMM合同價(jià)格約為每GB 8美元,較上季度大幅提升,主要反映LPDDR5X供應(yīng)緊張與整體DRAM價(jià)格上行。基于對2026年底移動(dòng)DRAM定價(jià)的預(yù)測,2026年底SOCAMM定價(jià)或超過每GB 13美元,全年均值約10美元為合理假設(shè)。
在此基礎(chǔ)上,SemiAnalysis認(rèn)為英偉達(dá)在SOCAMM上收取60%毛利率具有合理性:一是內(nèi)存供應(yīng)全面緊張,英偉達(dá)在SOCAMM采購上具有優(yōu)先獲取權(quán);二是VR NVL72在性能/TCO維度遠(yuǎn)超同期競品,客戶缺乏可替代選項(xiàng);三是英偉達(dá)本身已面臨SOCAMM采購成本的大幅上漲,向下游傳導(dǎo)具有合理依據(jù)。
此外,內(nèi)存定價(jià)不像GPU定價(jià)那樣面臨反壟斷顧慮,這給了英偉達(dá)更大的差異化定價(jià)空間——包括對Neocloud與超大規(guī)模云廠商實(shí)施差別定價(jià)。目前,英偉達(dá)在網(wǎng)絡(luò)設(shè)備上已對Neocloud收取約為超大規(guī)模云廠商兩倍的價(jià)格,同樣的邏輯完全可以延伸至內(nèi)存層面。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.