![]()
作者 | 褚杏娟
當(dāng)?shù)貢r(shí)間 5 月 14 日,Anthropic 以中美 AI 競(jìng)爭(zhēng)為由發(fā)布長(zhǎng)文,呼吁進(jìn)一步收緊芯片出口限制。
同一天稍早時(shí)候,路透社報(bào)道稱,美國(guó)已批準(zhǔn)約 10 家中國(guó)公司購(gòu)買英偉達(dá)專為中國(guó)市場(chǎng)定制的 H200 芯片。報(bào)道提到的公司包括阿里、騰訊、字節(jié)、京東等。不過,這批許可尚未轉(zhuǎn)化為實(shí)際交付。
Anthropic 直接指出,訓(xùn)練前沿 AI 模型最關(guān)鍵的資源是先進(jìn)芯片,也就是算力。美國(guó)目前的優(yōu)勢(shì)建立在 NVIDIA、AMD、TSMC 等“民主國(guó)家產(chǎn)業(yè)鏈”之上。但如果不進(jìn)一步收緊管制,美國(guó)在 2028 年前可能會(huì)失去主導(dǎo)權(quán),中國(guó) AI 實(shí)驗(yàn)室的模型能力可能追到只落后美國(guó)幾個(gè)月。
Anthropic 還引用了一組數(shù)據(jù),稱按總處理性能計(jì)算,華為在 2026 年的算力產(chǎn)出僅相當(dāng)于英偉達(dá)的 4%,到 2027 年更是降至 2%。
在 Anthropic 的框架里,中美 AI 競(jìng)爭(zhēng)被拆解為四條線:第一是智能,即誰能開發(fā)出最強(qiáng)大的 AI 模型;第二是國(guó)內(nèi)采用,即誰能更有效地把 AI 整合進(jìn)商業(yè)和公共部門;第三是全球分發(fā),即誰能部署支撐世界經(jīng)濟(jì)運(yùn)行的全球 AI 技術(shù)棧;第四是韌性,即誰能在 AI 帶來的經(jīng)濟(jì)社會(huì)轉(zhuǎn)型中維持穩(wěn)定和連續(xù)性。
其中,模型智能被認(rèn)為是最重要的一條,而這也是 Anthropic 收入的重要基石。
Anthropic 認(rèn)為,當(dāng)前中國(guó) AI 實(shí)驗(yàn)室之所以仍能接近美國(guó)模型能力,主要依靠三類因素:世界級(jí)人才、先進(jìn)算力,以及通過大規(guī)模“蒸餾攻擊”提取其前沿模型能力。為此,Anthropic 還提出,應(yīng)明確將“蒸餾攻擊”非法化,并加強(qiáng)情報(bào)共享;同時(shí)推動(dòng)美國(guó)“可信 AI 技術(shù)棧”出口,搶占全球南方市場(chǎng)。
一邊阻止先進(jìn)芯片外流,Anthropic 一邊正在斥巨資解決自身面臨的巨大算力短缺問題,同時(shí)通過頻繁調(diào)整產(chǎn)品價(jià)格,讓用戶來承擔(dān)算力短缺帶來的影響。
又又又調(diào)價(jià),開發(fā)者氣瘋了
在算力持續(xù)緊張的背景下,Anthropic 再一次調(diào)整了定價(jià)策略。
近日,Anthropic 宣布,從 6 月 15 日起,將把程序化 Claude 使用量與標(biāo)準(zhǔn)聊天訂閱額度拆分開來。也就是說,開發(fā)者通過 Agent SDK、GitHub Actions,以及 OpenClaw 等第三方智能體框架調(diào)用 Claude 時(shí),將不再簡(jiǎn)單計(jì)入原有訂閱套餐,而是進(jìn)入一個(gè)獨(dú)立的月度積分系統(tǒng),并按照類似 API 的方式計(jì)費(fèi)。
這一變化意味著,過去許多開發(fā)者用 Claude Pro 或 Max 套餐低成本運(yùn)行自動(dòng)化任務(wù)、智能體腳本、CI 流水線和長(zhǎng)期編碼代理的方式,將面臨重新定價(jià)。
根據(jù) Anthropic 的安排,程序化使用的月度積分額度將與用戶現(xiàn)有 Claude 訂閱檔位掛鉤,大體對(duì)應(yīng)其月費(fèi)水平。其中,Pro 用戶每月可獲得 20 美元積分,Max 5x 用戶為 100 美元,Max 20x 用戶為 200 美元。
在此之前,Claude 的交互式聊天使用和程序化調(diào)用來自同一個(gè)訂閱額度池。開發(fā)者不僅可以用高階 Claude 套餐進(jìn)行聊天、寫代碼、調(diào)試,也可以通過外部智能體框架運(yùn)行自動(dòng)化工作流。
正是這種“一個(gè)訂閱覆蓋多種用途”的模式,讓 Claude 一度成為智能體開發(fā)者眼中的高性價(jià)比選擇。尤其對(duì)于運(yùn)行長(zhǎng)期任務(wù)的開發(fā)者來說,通過 OpenClaw、Agent SDK 等工具調(diào)用 Claude,實(shí)際成本往往低于直接使用 API。
但 Anthropic 早在今年 4 月就已經(jīng)釋放信號(hào)。公司當(dāng)時(shí)在 X 上表示,Claude 訂閱將“不再覆蓋 OpenClaw 等第三方工具的使用量”,理由是算力容量受限。新政策落地后,開發(fā)者如果繼續(xù)使用外部智能體框架,要么購(gòu)買額外用量包,要么轉(zhuǎn)向直接 API 計(jì)費(fèi)。
有趣的是,Anthropic 首席財(cái)務(wù)官 Krishna Rao 在采訪中表示,“我們的定價(jià)一直比較穩(wěn)定。無論是 Haiku、Sonnet,還是 Opus,價(jià)格都沒有頻繁調(diào)整。現(xiàn)在 Mythos 當(dāng)然是比較新的模型,但總體來說,Anthropic 很少改價(jià)格。過去最大的一次價(jià)格調(diào)整,是在推出 Opus 4.5 時(shí),公司把 Opus 系列的價(jià)格降了下來。”
他解釋當(dāng)時(shí)的降價(jià)的原因在于,Anthropic 發(fā)現(xiàn) Opus 級(jí)模型的能力很強(qiáng),但實(shí)際使用量沒有完全匹配它的能力。很多客戶明明遇到的是一個(gè)適合用 Opus 解決的問題,卻會(huì)想辦法把它塞進(jìn) Sonnet 的工作負(fù)載里。后來,由于模型效率上又有提升,從 Anthropic 的角度看,已經(jīng)可以更高效地運(yùn)行 Opus,于是公司就把價(jià)格降下來,讓客戶更容易用上它。
這又回到一個(gè)核心點(diǎn):Anthropic 希望用戶使用自己的模型,這也價(jià)格必須設(shè)在一個(gè)用戶可以接受、并且能夠從中獲得足夠價(jià)值的位置上。
Krishna 認(rèn)為,“Opus 這次降價(jià),其實(shí)體現(xiàn)了杰文斯悖論:Anthropic 把價(jià)格降了下來,但使用量的增長(zhǎng)遠(yuǎn)遠(yuǎn)超過原本預(yù)期。也就是說,因?yàn)閮r(jià)格落到了客戶覺得合適的位置,他們開始更大量地使用 Opus。而 Anthropic 也有足夠的效率,可以支撐這種大規(guī)模使用。等客戶把它真正接入自己的工作流之后,Anthropic 再發(fā)布 Opus 4.6,它就是一次模型升級(jí),客戶可以直接替換進(jìn)去,而價(jià)格不需要再變。”
Krishna 強(qiáng)調(diào)定價(jià)穩(wěn)定很重要,但實(shí)際上,用戶對(duì)價(jià)格有很強(qiáng)的敏感度,很反感 Anthropic 一而再再而三地調(diào)整價(jià)格策略。
如之前調(diào)整一樣,最新調(diào)整很快就引發(fā)了開發(fā)者不滿。許多人認(rèn)為,Anthropic 正在削弱 Claude 對(duì)智能體工作流最有吸引力的一點(diǎn):用相對(duì)穩(wěn)定、可預(yù)測(cè)的訂閱價(jià)格,支撐大規(guī)模自動(dòng)化任務(wù)。
高級(jí)數(shù)據(jù)科學(xué)家 Yadesh Salvi 在 X 上批評(píng)稱,Anthropic 提供的月度額度“連一天的認(rèn)真工作都撐不過去”。他認(rèn)為,Claude Agent SDK 和 Claude Code 中的claude -p等功能原本是用戶高頻使用的核心能力,如今卻被壓縮使用空間,還被包裝成訂閱福利。
Broadcom 高級(jí)站點(diǎn)可靠性工程師 Advait Patel 也表示,對(duì)于那些基于 Claude Pro 或 Max 固定價(jià)格套餐構(gòu)建副業(yè)項(xiàng)目和個(gè)人自動(dòng)化工具的開發(fā)者來說,新的獨(dú)立積分池確實(shí)能給開發(fā)者一點(diǎn)試驗(yàn)空間,但一旦智能體足夠有用、需要頻繁運(yùn)行,開發(fā)者就不可避免地進(jìn)入按量計(jì)費(fèi)模式。
![]()
“重度智能體用戶消耗的算力,遠(yuǎn)遠(yuǎn)超過 20 美元或 100 美元訂閱能夠支撐的范圍。”Patel 認(rèn)為,運(yùn)行大模型本身確實(shí)昂貴,面向程序化使用的無限固定價(jià)格套餐,本來就很難長(zhǎng)期持續(xù)。同樣的錢,能跑的自動(dòng)化任務(wù)變少了,想保持原來的使用強(qiáng)度,就要額外付費(fèi)。
這場(chǎng)定價(jià)變化影響的不只是個(gè)人開發(fā)者,也會(huì)給企業(yè)帶來新的成本管理問題。Patel 指出,過去一些團(tuán)隊(duì)會(huì)依賴 Claude 訂閱運(yùn)行無人值守工作流,例如 CI 流水線、定時(shí)自動(dòng)化任務(wù)和長(zhǎng)時(shí)間運(yùn)行的編碼智能體。但在新政策下,使用量將更直接地與 token 消耗綁定,而不是簡(jiǎn)單跟訂閱檔位綁定。
這會(huì)讓企業(yè)在預(yù)算預(yù)測(cè)上面臨更大不確定性。尤其是那些涉及多次重試、大上下文窗口、多步驟智能體循環(huán)的工作負(fù)載,其 token 消耗可能快速膨脹。
更麻煩的是,Anthropic 的積分是按用戶分配的,不能在團(tuán)隊(duì)之間共享。這意味著企業(yè)無法輕松建立一個(gè)統(tǒng)一預(yù)算池來覆蓋共享自動(dòng)化任務(wù)。一個(gè)失控的智能體,或者一個(gè)設(shè)計(jì)不佳的提示詞,都可能迅速燒光個(gè)人額度,導(dǎo)致任務(wù)中斷或者開始產(chǎn)生額外費(fèi)用。
![]()
高額的費(fèi)用讓微軟也有了壓力。據(jù)外媒報(bào)道,微軟已開始逐步取消數(shù)千名內(nèi)部開發(fā)者的 Claude Code 授權(quán)。盡管過去半年這個(gè) AI 編程工具深受微軟員工歡迎,但公司決定將重點(diǎn)收縮至自家的 GitHub Copilot CLI。
微軟向員工解釋說,此舉是為了將 Copilot CLI 作為其在“體驗(yàn)與設(shè)備”領(lǐng)域的主要代理命令行界面工具,但消息人士稱,此舉也與財(cái)務(wù)有關(guān)。6 月 30 日是微軟當(dāng)前財(cái)年的最后一天,取消 Claude Code 許可證是削減運(yùn)營(yíng)開支的簡(jiǎn)便方法,以便在 7 月新財(cái)年開始時(shí)節(jié)省開支。
近幾個(gè)月來,微軟內(nèi)部開發(fā)者更傾向于使用 Claude Code 而非 GitHub Copilot CLI。對(duì)于內(nèi)部員工來說,從 Claude Code 過渡到 GitHub Copilot 并非易事。微軟一直鼓勵(lì)沒有編程經(jīng)驗(yàn)的員工嘗試使用 Claude Code,以便設(shè)計(jì)師和項(xiàng)目經(jīng)理能夠快速構(gòu)建原型。微軟最初還希望員工同時(shí)使用 Claude Code 和 GitHub Copilot,以便比較兩者并提供反饋。
現(xiàn)在,微軟的 GitHub 團(tuán)隊(duì)面臨著巨大的壓力,他們需要改進(jìn) Copilot CLI,并力爭(zhēng)超越 Claude Code。
可以看到,Claude Code 雖然得到了能力認(rèn)可,但一旦價(jià)格超出用戶負(fù)擔(dān),無論個(gè)人還是企業(yè),都會(huì)考慮選擇其他產(chǎn)品,這對(duì) Codex、Copilot 們來說,也是一次機(jī)會(huì)。
“算力是我們整個(gè)業(yè)務(wù)的生命線”
擁有更多算力是 Anthropic 最直接的解法。
“我們采購(gòu)的算力,基本就是整個(gè)業(yè)務(wù)的生命線。”Krishna 也在近期參加播客節(jié)目時(shí)表示。
Anthropic 近期大規(guī)模采購(gòu)算力,也說明了這一點(diǎn)。該公司已經(jīng)獨(dú)家租用 SpaceX Colossus 1 超算中心;與 AWS 長(zhǎng)期合作,鎖定 5GW Trainium 算力,10 年投入超 1000 億美元;簽約 Google 與 Broadcom 的下一代 TPU 長(zhǎng)單,3.5GW 算力將從 2027 年起交付。去年,Anthropic 還宣布投入 500 億美元自建美國(guó) AI 基礎(chǔ)設(shè)施,并同步加碼 Google TPU 與 Microsoft Azure 算力。
值得一提的是,Krishna 明確表示,公司內(nèi)部并沒有看到 scaling laws 放緩的跡象。
在 Anthropic 內(nèi)部,scaling laws 的討論也與不同開發(fā)階段密切相關(guān)。Krishna 表示,公司會(huì)看模型在不同開發(fā)階段的表現(xiàn)。比如,在一次預(yù)訓(xùn)練運(yùn)行過程中,Anthropic 可以從損失曲線上看到,這個(gè)模型和之前訓(xùn)練過的模型相比表現(xiàn)怎么樣。這樣一來,公司就能對(duì)模型能力有一個(gè)基本判斷。
在強(qiáng)化學(xué)習(xí)階段,也可以用類似的方式來看。還有一點(diǎn)同樣重要,就是當(dāng)客戶真正拿到模型之后,他們看到了什么、在哪些地方發(fā)現(xiàn)了問題。這些痛點(diǎn)之后就會(huì)變成 Anthropic 的訓(xùn)練目標(biāo)。
當(dāng)然,在企業(yè)側(cè),Anthropic 不會(huì)用客戶數(shù)據(jù)來訓(xùn)練模型,但客戶會(huì)告訴 Anthropic 一些很具體的反饋。比如:“我希望模型在這個(gè)方面更好”,或者“我在某個(gè)地方被卡住了”,Anthropic 通常會(huì)按這個(gè)方向去做產(chǎn)品,因?yàn)楣緯?huì)在研發(fā)側(cè)持續(xù)推進(jìn),隨著時(shí)間推移把這些能力提升上來。
所以,這里面其實(shí)形成了一個(gè)相互連接的循環(huán)。在內(nèi)部,Anthropic 會(huì)一直觀察不同訓(xùn)練階段的模型、不同版本的模型快照,把它們和自己的指標(biāo)做比較,也會(huì)和外部模型做一些比較;最終,公司還會(huì)看客戶怎么評(píng)價(jià)這些模型。
Krishna 補(bǔ)充解釋道,Anthropic 確實(shí)非常相信 scaling laws。“當(dāng)然,很多 scaling laws 論文的作者本來就是 Anthropic 的創(chuàng)始人。但即便如此,公司內(nèi)部其實(shí)也是一群帶著懷疑精神的人。至少?gòu)哪壳翱吹降那闆r來看,scaling laws 并沒有放緩。”
因此,單從模型開發(fā)層面,Anthropic 就有動(dòng)力持續(xù)進(jìn)行算力投入,更何況其背后還有眾多用戶。
克制采購(gòu)、大量異構(gòu)算力終于可以快速消化
“對(duì)公司來說,算力是最重要的資源,也是其他一切能力建立起來的基礎(chǔ)。所以,到底要買多少算力,是公司里最關(guān)鍵、也最難做的決策之一。”Krishna 解釋稱,算力買多了,公司可能會(huì)被成本拖垮;算力買少了,又沒辦法服務(wù)客戶,也沒辦法繼續(xù)站在技術(shù)前沿。某種意義上,這兩個(gè)結(jié)果都很危險(xiǎn)。
因此,對(duì) Anthropic 來說,算力采購(gòu)不是一個(gè)可以臨時(shí)拍板的事情,它會(huì)帶來非常現(xiàn)實(shí)的后果。公司不可能今天說要買一吉瓦算力,下周它就交付。很多事情都必須提前規(guī)劃。
據(jù) Krishna 介紹,Anthropic 在思考算力問題時(shí),會(huì)盡量用一套系統(tǒng)的方法來判斷。公司會(huì)從具體需求往上推,建模型、預(yù)測(cè)未來可能需要多少算力。當(dāng)然,這些預(yù)測(cè)有時(shí)候也會(huì)出錯(cuò)。公司還要判斷,如果想繼續(xù)保持在前沿,到底需要準(zhǔn)備多少算力,并且盡量根據(jù)未來的發(fā)展去估算。
“等到真正去做算力采購(gòu)交易時(shí),靈活性就非常重要。”Krishna 強(qiáng)調(diào),Anthropic 會(huì)把這種靈活性寫進(jìn)合同里,也會(huì)體現(xiàn)在后續(xù)使用算力的方式里。因?yàn)楫?dāng)業(yè)務(wù)進(jìn)入指數(shù)級(jí)增長(zhǎng)階段,最關(guān)鍵的就是盡可能高效地使用手里的算力。
“即便到今天,我大概仍然有 30% 到 40% 的時(shí)間花在算力上。”他說道。
在 Anthropic 的語境里,靈活性有好幾層意思。首先,公司不是只押注一種芯片平臺(tái)。現(xiàn)在 Anthropic 同時(shí)使用三類芯片:Amazon 的 Trainium、Google 的 TPU,以及 Nvidia 的 GPU。對(duì)公司來說,這些芯片可以在不同場(chǎng)景里相互替換、靈活調(diào)度。
Anthropic 買來的算力,會(huì)被用在幾類事情上:一類是模型開發(fā),一類是內(nèi)部使用,比如加速自己的產(chǎn)品和模型研發(fā),當(dāng)然還有一類是對(duì)外服務(wù)客戶。無論是 Trainium、TPU 還是 GPU,Anthropic 都會(huì)盡量讓它們覆蓋這些內(nèi)部和外部場(chǎng)景,而不是把某一種芯片固定死在某一種用途上。
但這種靈活性不是一開始就有的。Anthropic 花了很多年時(shí)間,持續(xù)投入,才慢慢做到今天這個(gè)程度。Krishna 認(rèn)為,在所有前沿實(shí)驗(yàn)室里,Anthropic 可能是最高效的算力使用者之一。
比如 Anthropic 剛開始用 TPU 的時(shí)候,Krishna 記得大概還是第三代 TPU。那是 Anthropic 第一次大規(guī)模使用 TPU。很多人當(dāng)時(shí)都不理解,覺得:“你們是不是瘋了?大家都在用 GPU,為什么你們不用 GPU?”但 Anthropic 一直很重視這件事,因?yàn)楣镜哪繕?biāo)就是能夠非常靈活地使用各種算力。
除此之外,Anthropic 還會(huì)比較同一芯片平臺(tái)的不同代際,看哪一代芯片最適合哪一種內(nèi)部工作負(fù)載,然后把它放到最合適的位置上。也正因?yàn)檫@樣,公司后來真正搭起了一套編排層。它的作用就是幫 Anthropic 靈活調(diào)度不同類型、不同代際的算力,并在這個(gè)過程中,把每一份算力的價(jià)值盡可能榨出來。
一方面,公司會(huì)貼近底層硬件做優(yōu)化,盡量少被中間軟件層限制,從而控制更多性能變量;另一方面,這也是一個(gè)與各方緊密協(xié)作的過程。比如,Anthropic 和 Amazon 的 Annapurna Labs 團(tuán)隊(duì)合作非常緊密,也會(huì)參與影響這些芯片的路線圖。
因?yàn)?Anthropic 認(rèn)為,公司正在做的事情確實(shí)是在把這些芯片的能力推到極限。這也意味著,在 Anthropic 內(nèi)部,一美元算力所產(chǎn)生的價(jià)值,比在其他任何地方都要更高。
Krishna 坦言,今天在這些使用場(chǎng)景里,Anthropic 其實(shí)都受算力限制。如果放在一兩年前,突然給 Anthropic 一批不同類型的算力,公司確實(shí)很難馬上消化掉。因?yàn)檫@些芯片平臺(tái)彼此不一樣,有些更難操作,有些在使用方式上也有自己的特點(diǎn)。
但今天不一樣了。如果現(xiàn)在給 Anthropic 更多算力,公司會(huì)很快把它部署到不同的使用場(chǎng)景里。整體分配方式可能和今天差不多,但 Anthropic 現(xiàn)在已經(jīng)更擅長(zhǎng)快速啟動(dòng)、快速部署幾乎任何類型的算力。Krishna 認(rèn)為,這也是公司的一個(gè)真正優(yōu)勢(shì)。
性價(jià)比很重要,要把算力拆得非常細(xì)
Anthropic 已經(jīng)宣布與 SpaceX 在 Memphis 的 Colossus 設(shè)施合作。這就是一個(gè)很好的例子,來證明,只要能拿到近期算力(near-term compute),Anthropic 都會(huì)去尋找機(jī)會(huì)。
隨著算力基數(shù)越來越大,這類近期算力在整體可用算力中的占比會(huì)越來越小,但 Anthropic 看它的核心標(biāo)準(zhǔn)是:這些可用算力能不能有效部署起來。
答案有時(shí)候是可以,有時(shí)候是不行。如果可以,Anthropic 就會(huì)繼續(xù)看它的經(jīng)濟(jì)回報(bào):價(jià)格怎么樣、能用多久、位置在哪里、屬于哪種類型的算力,以及公司能不能高效地運(yùn)行它。所以,Anthropic 內(nèi)部有一套評(píng)估流程。
這套流程也會(huì)用來評(píng)估長(zhǎng)期交易。上個(gè)月,Anthropic 和 Google、Broadcom 簽了一個(gè)五吉瓦的 TPU 合作,從 2027 年開始。Anthropic 也和 Amazon 簽了一個(gè)最高五吉瓦的 Trainium 交易,這是一個(gè)超過 1000 億美元的承諾,其中很多算力其實(shí)已經(jīng)開始落地,并且會(huì)在今明兩年里繼續(xù)落地。
Krishna 將其形容成一層層疊起來的“算力蛋糕”(layer cake):不同算力會(huì)在不同時(shí)間啟動(dòng),能力也不一樣,而 Anthropic 會(huì)非常動(dòng)態(tài)地比較這些算力。對(duì)公司來說,算力隨著時(shí)間變化的性價(jià)比非常重要,它什么時(shí)候能落地,以及公司認(rèn)為它能在業(yè)務(wù)內(nèi)部發(fā)揮什么作用,也同樣重要。這里有很多變量需要一起優(yōu)化:它是什么類型的算力、成本是多少、使用周期有多長(zhǎng)等。Anthropic 會(huì)用一套相當(dāng)動(dòng)態(tài)的方式去看近期算力、中期算力和長(zhǎng)期算力。評(píng)估的核心大體相同,只是時(shí)間周期不同。
在評(píng)估算力時(shí),Anthropic 也會(huì)看每 token 成本、吞吐量和速度之間的取舍。Krishna 提到,當(dāng) Anthropic 同時(shí)看三個(gè)不同芯片平臺(tái)時(shí),每個(gè)平臺(tái)里面其實(shí)還有不同代際的芯片,比如 TPU V5e、V6、V7,Trainium 2、Trainium 3,它們?cè)谛詢r(jià)比曲線上的位置都不一樣。
接下來很重要的一點(diǎn),是看公司準(zhǔn)備怎么用這些算力。性價(jià)比當(dāng)然重要,因?yàn)樗苯雨P(guān)系到效率;但對(duì)某些使用場(chǎng)景來說,速度也同樣重要。所以,Anthropic 會(huì)把算力拆得非常細(xì),細(xì)到它什么時(shí)候能交付、能交付什么能力。
這件事主要由 Anthropic 的算力團(tuán)隊(duì)主導(dǎo),但整個(gè)公司也會(huì)密切配合,一起討論哪些地方需要這些算力、具體是為了什么。比如,公司可能需要 CPU 來做強(qiáng)化學(xué)習(xí),也可能需要更前沿的算力來運(yùn)行最好、最快的模型,或者用來訓(xùn)練這些模型。所以,從 Anthropic 的角度看,算力怎么用,既取決于客戶需求,也取決于一個(gè)非常細(xì)的問題:每種芯片最適合做什么,以及公司什么時(shí)候能夠拿到它。
模型開發(fā)有算力保底,內(nèi)部員工的也得給
Anthropic 現(xiàn)在想要達(dá)到的狀態(tài)是:首先仍然要站在前沿,這是最重要的;其次要能夠服務(wù)客戶;同時(shí)還要有足夠的內(nèi)部算力來加速員工推進(jìn)工作。
除了討論怎么買算力,Anthropic 也經(jīng)常開會(huì)討論算力怎么分配。Krishna 認(rèn)為,這套討論方式和公司文化有關(guān)。Anthropic 的文化非常強(qiáng)調(diào)協(xié)作,所以大家討論算力分配時(shí),也不是各自守著自己的“地盤”,更不是零和博弈,而是用一種非常協(xié)作的方式來推進(jìn)。
但在模型開發(fā)這件事上,Anthropic 會(huì)設(shè)一個(gè)不會(huì)低于的算力底線。也就是說,哪怕這會(huì)讓服務(wù)客戶變得更困難,或者不得不在某些地方采取一些不太常規(guī)的做法,公司仍然會(huì)繼續(xù)做長(zhǎng)期投入,去開發(fā)最好的模型。因?yàn)?Anthropic 認(rèn)為,前沿智能的回報(bào)非常高,尤其是在企業(yè)領(lǐng)域。所以,分配給模型開發(fā)的算力,會(huì)有一個(gè)明確的下限。
而內(nèi)部團(tuán)隊(duì)也會(huì)分走一部分算力。Krishna 提到一個(gè)很有意思的點(diǎn)。如果公司對(duì)員工說,“你們不能再使用我們的模型了”,那么 Anthropic 分配給員工內(nèi)部使用的這些算力,其實(shí)可以支撐數(shù)十億美元的收入。
實(shí)際上,Anthropic 現(xiàn)在內(nèi)部 90% 以上的代碼,其實(shí)都是由 Claude Code 寫的。很多 Claude Code 本身,也是在 Claude Code 的幫助下寫出來的。這一程度上解釋了 Anthropic 為什么要把部分算力留給給內(nèi)部使用,因?yàn)槟P捅旧碚趲椭?Anthropic 構(gòu)建下一代模型。
Krishna 表示,公司內(nèi)部討論算力分配問題時(shí),每個(gè)團(tuán)隊(duì)都會(huì)說明:如果拿到這些算力,他們會(huì)用來做什么。接著,大家會(huì)非常開放、坦誠(chéng)地討論這些投入的回報(bào)該怎么看。因?yàn)?Anthropic 可以非常動(dòng)態(tài)地分配算力,所以也能在相對(duì)較短的時(shí)間內(nèi)做出調(diào)整和改變。
這期間,Krishna 還強(qiáng)調(diào)了人的作用。擁有最好模型的人才,可以加速能力發(fā)展。
他解釋稱,Anthropic 其實(shí)不太用“閉源”或“開源”來區(qū)分模型,而是會(huì)把模型分成“在前沿”和“不在前沿”。那些站在前沿的模型,顯然正在捕獲經(jīng)濟(jì)價(jià)值,也在為客戶帶來有意義的投資回報(bào)。Anthropic 現(xiàn)在做的,就是繼續(xù)圍繞這個(gè)判斷加大投入。這既意味著投入算力,也意味著投入那些能夠用好算力、并且能夠用 Anthropic 自己的模型來真正加速開發(fā)的人才。
不只模型,還包括構(gòu)建在模型之上的產(chǎn)品。比如,Anthropic 在一月發(fā)布了三十個(gè)不同的產(chǎn)品和功能。這個(gè)節(jié)奏也在加快。這部分也得益于公司把模型和現(xiàn)有人才結(jié)合起來,讓人們能夠更快、更有效地使用底層智能。這基本上就是 Anthropic 在產(chǎn)品側(cè)的判斷。
Krishna 強(qiáng)調(diào),Anthropic 的核心仍然是一個(gè)研究實(shí)驗(yàn)室,是那些不斷推動(dòng)模型能力上限的事情。公司一切都建立在這套研究體系之上。
今天,這套研究體系確實(shí)已經(jīng)被模型賦能了,但還不是完全由模型自己完成。隨著時(shí)間推移,Anthropic 認(rèn)為模型會(huì)變得更強(qiáng),也會(huì)在研究過程中提供更多幫助。但研究方向怎么定、優(yōu)先級(jí)怎么排、哪些新領(lǐng)域值得探索,仍然需要最優(yōu)秀的研究人才來判斷和設(shè)定。模型的加入,是在進(jìn)一步放大這些研究人才的能力。
所以,Krishna 把模型看成一種放大器:它不是取代 Anthropic 已有的人才,而是在強(qiáng)化和加速這些人才。人們經(jīng)常說,人才密度比人才規(guī)模更重要,Krishna 認(rèn)為在這里同樣成立。
Anthropic 真正想要的,是聚集最優(yōu)秀、最密集的一批 AI 研究人才和推理工程人才,再用最好的模型放大他們的能力。Anthropic 認(rèn)為,這會(huì)形成一個(gè)非常有競(jìng)爭(zhēng)力的組合。
算力,不是 Anthropic 的某一項(xiàng)具體成本
Krishna 透露,Anthropic 看算力投入,不會(huì)只看某一項(xiàng)具體成本,而是看整塊算力支出到底能帶來多少回報(bào)。這里說的“整塊”,包括各種用途:服務(wù)客戶、模型開發(fā)、內(nèi)部提效等等。可以把它們理解成在不同時(shí)間尺度上支持收入增長(zhǎng)的事情。
比如,現(xiàn)在用算力做推理,它直接支撐今天的收入;如果把算力用在模型開發(fā)上,它可能會(huì)在六個(gè)月后帶來新的模型能力,打開新的市場(chǎng)空間,進(jìn)而推動(dòng)未來收入增長(zhǎng);如果把算力用于內(nèi)部提效,幫助團(tuán)隊(duì)更快推出新產(chǎn)品,這本質(zhì)上也在支持收入。
所以,Anthropic 真正看的不是某一筆算力花費(fèi)本身,而是整個(gè)算力池的總體回報(bào)。至少?gòu)慕裉靵砜矗琄rishna 認(rèn)為 Anthropic 在算力上的投入回報(bào)是很穩(wěn)健的。公司一方面要為客戶創(chuàng)造價(jià)值,另一方面也要確保自己能從算力投入中獲得足夠強(qiáng)的回報(bào)。站在這個(gè)角度看,Anthropic 對(duì)目前的位置比較有信心。
再看第一季度的收入增長(zhǎng),那段時(shí)間收入漲得很快,但并不是因?yàn)?Anthropic 突然上線了一大批新算力。算力通常是按照很早以前就確定好的節(jié)奏逐步到位的,很多時(shí)候這個(gè)節(jié)奏可能在十二個(gè)月前就已經(jīng)定下來了。
所以,在 Krishna 看來,如果把服務(wù)每一個(gè)客戶都簡(jiǎn)單理解成一筆“新增變量成本”,其實(shí)不太適合 Anthropic 的業(yè)務(wù)。那更像是在用傳統(tǒng)軟件公司的邏輯來套它,但真實(shí)情況不是這樣。
他解釋稱,算力不是只對(duì)應(yīng)某一個(gè)客戶、某一項(xiàng)成本,它同時(shí)支撐客戶服務(wù)、模型研發(fā)、內(nèi)部提效等一整套活動(dòng)。而 Anthropic 衡量的核心,就是這整套算力投入到底能不能帶來穩(wěn)健回報(bào)。因此,Anthropic 會(huì)把現(xiàn)有的算力池看成一個(gè)關(guān)鍵約束條件。它決定了公司短期能服務(wù)多少客戶、長(zhǎng)期能推動(dòng)多少模型和產(chǎn)品能力,也決定了最終能帶動(dòng)多少收入。
Amazon、Google、Microsoft 都是 Anthropic 的重要合作伙伴,Broadcom 和 Nvidia 也是如此。Krishna 表示,Anthropic 的生態(tài)系統(tǒng)很強(qiáng)。今天,Anthropic 是唯一一個(gè)同時(shí)出現(xiàn)在三大云上的模型,也是唯一一家使用這三種芯片平臺(tái)的語言模型實(shí)驗(yàn)室。
“這些合作遠(yuǎn)遠(yuǎn)不只是采購(gòu)。”Krishna 認(rèn)為,這一點(diǎn)經(jīng)常被忽視。
比如 Anthropic 和 Amazon 的關(guān)系,Anthropic 的團(tuán)隊(duì)和 Annapurna Labs 團(tuán)隊(duì)是深度綁定在一起的。Anthropic 非常擅長(zhǎng)使用 Trainium,也投入了大量時(shí)間和精力,和 Amazon 團(tuán)隊(duì)密切合作,雙方會(huì)一起做容量規(guī)劃。
“再看三大云,它們對(duì) Anthropic 來說也是非常好的分發(fā)渠道。”Krishna 進(jìn)一步解釋道,“當(dāng)然,Anthropic 自己的一方業(yè)務(wù)也非常強(qiáng)。但總體來看,這些合作關(guān)系都是多維度的,不只是買算力這么簡(jiǎn)單,包括了芯片本身的開發(fā)、容量落地、服務(wù)交付,最后還包括把這些能力分發(fā)給客戶。”
https://www.anthropic.com/research/2028-ai-leadership
https://www.reuters.com/business/retail-consumer/us-clears-h200-chip-sales-10-china-firms-nvidia-ceo-looks-breakthrough-2026-05-14/
https://www.infoworld.com/article/4171274/anthropic-puts-claude-agents-on-a-meter-across-its-subscriptions.html
https://www.theverge.com/tech/930447/microsoft-claude-code-discontinued-notepad
聲明:本文為 AI 前線原創(chuàng),不代表平臺(tái)觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。
會(huì)議推薦
Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發(fā)體系不重構(gòu),還能撐多久?
AICon 上海站 2026,13 大重磅專題已上線,誠(chéng)摯邀請(qǐng)你登臺(tái)分享實(shí)戰(zhàn)經(jīng)驗(yàn)。AICon 2026,期待與你同行。快來掃碼鎖定 8 折專屬席位或提交演講議題
今日薦文
![]()
你也「在看」嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.