網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

H200還沒到中國(guó)，Anthropic先急了：千億美元搶芯片，轉(zhuǎn)頭漲價(jià)讓開發(fā)者買單

2026-05-16 15:34:16　來源: AI前線

北京舉報(bào)

分享至

作者 | 褚杏娟

當(dāng)?shù)貢r(shí)間 5 月 14 日，Anthropic 以中美 AI 競(jìng)爭(zhēng)為由發(fā)布長(zhǎng)文，呼吁進(jìn)一步收緊芯片出口限制。

同一天稍早時(shí)候，路透社報(bào)道稱，美國(guó)已批準(zhǔn)約 10 家中國(guó)公司購(gòu)買英偉達(dá)專為中國(guó)市場(chǎng)定制的 H200 芯片。報(bào)道提到的公司包括阿里、騰訊、字節(jié)、京東等。不過，這批許可尚未轉(zhuǎn)化為實(shí)際交付。

Anthropic 直接指出，訓(xùn)練前沿 AI 模型最關(guān)鍵的資源是先進(jìn)芯片，也就是算力。美國(guó)目前的優(yōu)勢(shì)建立在 NVIDIA、AMD、TSMC 等“民主國(guó)家產(chǎn)業(yè)鏈”之上。但如果不進(jìn)一步收緊管制，美國(guó)在 2028 年前可能會(huì)失去主導(dǎo)權(quán)，中國(guó) AI 實(shí)驗(yàn)室的模型能力可能追到只落后美國(guó)幾個(gè)月。

Anthropic 還引用了一組數(shù)據(jù)，稱按總處理性能計(jì)算，華為在 2026 年的算力產(chǎn)出僅相當(dāng)于英偉達(dá)的 4%，到 2027 年更是降至 2%。

在 Anthropic 的框架里，中美 AI 競(jìng)爭(zhēng)被拆解為四條線：第一是智能，即誰能開發(fā)出最強(qiáng)大的 AI 模型；第二是國(guó)內(nèi)采用，即誰能更有效地把 AI 整合進(jìn)商業(yè)和公共部門；第三是全球分發(fā)，即誰能部署支撐世界經(jīng)濟(jì)運(yùn)行的全球 AI 技術(shù)棧；第四是韌性，即誰能在 AI 帶來的經(jīng)濟(jì)社會(huì)轉(zhuǎn)型中維持穩(wěn)定和連續(xù)性。

其中，模型智能被認(rèn)為是最重要的一條，而這也是 Anthropic 收入的重要基石。

Anthropic 認(rèn)為，當(dāng)前中國(guó) AI 實(shí)驗(yàn)室之所以仍能接近美國(guó)模型能力，主要依靠三類因素：世界級(jí)人才、先進(jìn)算力，以及通過大規(guī)模“蒸餾攻擊”提取其前沿模型能力。為此，Anthropic 還提出，應(yīng)明確將“蒸餾攻擊”非法化，并加強(qiáng)情報(bào)共享；同時(shí)推動(dòng)美國(guó)“可信 AI 技術(shù)棧”出口，搶占全球南方市場(chǎng)。

一邊阻止先進(jìn)芯片外流，Anthropic 一邊正在斥巨資解決自身面臨的巨大算力短缺問題，同時(shí)通過頻繁調(diào)整產(chǎn)品價(jià)格，讓用戶來承擔(dān)算力短缺帶來的影響。

又又又調(diào)價(jià)，開發(fā)者氣瘋了

在算力持續(xù)緊張的背景下，Anthropic 再一次調(diào)整了定價(jià)策略。

近日，Anthropic 宣布，從 6 月 15 日起，將把程序化 Claude 使用量與標(biāo)準(zhǔn)聊天訂閱額度拆分開來。也就是說，開發(fā)者通過 Agent SDK、GitHub Actions，以及 OpenClaw 等第三方智能體框架調(diào)用 Claude 時(shí)，將不再簡(jiǎn)單計(jì)入原有訂閱套餐，而是進(jìn)入一個(gè)獨(dú)立的月度積分系統(tǒng)，并按照類似 API 的方式計(jì)費(fèi)。

這一變化意味著，過去許多開發(fā)者用 Claude Pro 或 Max 套餐低成本運(yùn)行自動(dòng)化任務(wù)、智能體腳本、CI 流水線和長(zhǎng)期編碼代理的方式，將面臨重新定價(jià)。

根據(jù) Anthropic 的安排，程序化使用的月度積分額度將與用戶現(xiàn)有 Claude 訂閱檔位掛鉤，大體對(duì)應(yīng)其月費(fèi)水平。其中，Pro 用戶每月可獲得 20 美元積分，Max 5x 用戶為 100 美元，Max 20x 用戶為 200 美元。

在此之前，Claude 的交互式聊天使用和程序化調(diào)用來自同一個(gè)訂閱額度池。開發(fā)者不僅可以用高階 Claude 套餐進(jìn)行聊天、寫代碼、調(diào)試，也可以通過外部智能體框架運(yùn)行自動(dòng)化工作流。

正是這種“一個(gè)訂閱覆蓋多種用途”的模式，讓 Claude 一度成為智能體開發(fā)者眼中的高性價(jià)比選擇。尤其對(duì)于運(yùn)行長(zhǎng)期任務(wù)的開發(fā)者來說，通過 OpenClaw、Agent SDK 等工具調(diào)用 Claude，實(shí)際成本往往低于直接使用 API。

但 Anthropic 早在今年 4 月就已經(jīng)釋放信號(hào)。公司當(dāng)時(shí)在 X 上表示，Claude 訂閱將“不再覆蓋 OpenClaw 等第三方工具的使用量”，理由是算力容量受限。新政策落地后，開發(fā)者如果繼續(xù)使用外部智能體框架，要么購(gòu)買額外用量包，要么轉(zhuǎn)向直接 API 計(jì)費(fèi)。

有趣的是，Anthropic 首席財(cái)務(wù)官 Krishna Rao 在采訪中表示，“我們的定價(jià)一直比較穩(wěn)定。無論是 Haiku、Sonnet，還是 Opus，價(jià)格都沒有頻繁調(diào)整。現(xiàn)在 Mythos 當(dāng)然是比較新的模型，但總體來說，Anthropic 很少改價(jià)格。過去最大的一次價(jià)格調(diào)整，是在推出 Opus 4.5 時(shí)，公司把 Opus 系列的價(jià)格降了下來。”

他解釋當(dāng)時(shí)的降價(jià)的原因在于，Anthropic 發(fā)現(xiàn) Opus 級(jí)模型的能力很強(qiáng)，但實(shí)際使用量沒有完全匹配它的能力。很多客戶明明遇到的是一個(gè)適合用 Opus 解決的問題，卻會(huì)想辦法把它塞進(jìn) Sonnet 的工作負(fù)載里。后來，由于模型效率上又有提升，從 Anthropic 的角度看，已經(jīng)可以更高效地運(yùn)行 Opus，于是公司就把價(jià)格降下來，讓客戶更容易用上它。

這又回到一個(gè)核心點(diǎn)：Anthropic 希望用戶使用自己的模型，這也價(jià)格必須設(shè)在一個(gè)用戶可以接受、并且能夠從中獲得足夠價(jià)值的位置上。

Krishna 認(rèn)為，“Opus 這次降價(jià)，其實(shí)體現(xiàn)了杰文斯悖論：Anthropic 把價(jià)格降了下來，但使用量的增長(zhǎng)遠(yuǎn)遠(yuǎn)超過原本預(yù)期。也就是說，因?yàn)閮r(jià)格落到了客戶覺得合適的位置，他們開始更大量地使用 Opus。而 Anthropic 也有足夠的效率，可以支撐這種大規(guī)模使用。等客戶把它真正接入自己的工作流之后，Anthropic 再發(fā)布 Opus 4.6，它就是一次模型升級(jí)，客戶可以直接替換進(jìn)去，而價(jià)格不需要再變。”

Krishna 強(qiáng)調(diào)定價(jià)穩(wěn)定很重要，但實(shí)際上，用戶對(duì)價(jià)格有很強(qiáng)的敏感度，很反感 Anthropic 一而再再而三地調(diào)整價(jià)格策略。

如之前調(diào)整一樣，最新調(diào)整很快就引發(fā)了開發(fā)者不滿。許多人認(rèn)為，Anthropic 正在削弱 Claude 對(duì)智能體工作流最有吸引力的一點(diǎn)：用相對(duì)穩(wěn)定、可預(yù)測(cè)的訂閱價(jià)格，支撐大規(guī)模自動(dòng)化任務(wù)。

高級(jí)數(shù)據(jù)科學(xué)家 Yadesh Salvi 在 X 上批評(píng)稱，Anthropic 提供的月度額度“連一天的認(rèn)真工作都撐不過去”。他認(rèn)為，Claude Agent SDK 和 Claude Code 中的claude -p等功能原本是用戶高頻使用的核心能力，如今卻被壓縮使用空間，還被包裝成訂閱福利。

Broadcom 高級(jí)站點(diǎn)可靠性工程師 Advait Patel 也表示，對(duì)于那些基于 Claude Pro 或 Max 固定價(jià)格套餐構(gòu)建副業(yè)項(xiàng)目和個(gè)人自動(dòng)化工具的開發(fā)者來說，新的獨(dú)立積分池確實(shí)能給開發(fā)者一點(diǎn)試驗(yàn)空間，但一旦智能體足夠有用、需要頻繁運(yùn)行，開發(fā)者就不可避免地進(jìn)入按量計(jì)費(fèi)模式。

“重度智能體用戶消耗的算力，遠(yuǎn)遠(yuǎn)超過 20 美元或 100 美元訂閱能夠支撐的范圍。”Patel 認(rèn)為，運(yùn)行大模型本身確實(shí)昂貴，面向程序化使用的無限固定價(jià)格套餐，本來就很難長(zhǎng)期持續(xù)。同樣的錢，能跑的自動(dòng)化任務(wù)變少了，想保持原來的使用強(qiáng)度，就要額外付費(fèi)。

這場(chǎng)定價(jià)變化影響的不只是個(gè)人開發(fā)者，也會(huì)給企業(yè)帶來新的成本管理問題。Patel 指出，過去一些團(tuán)隊(duì)會(huì)依賴 Claude 訂閱運(yùn)行無人值守工作流，例如 CI 流水線、定時(shí)自動(dòng)化任務(wù)和長(zhǎng)時(shí)間運(yùn)行的編碼智能體。但在新政策下，使用量將更直接地與 token 消耗綁定，而不是簡(jiǎn)單跟訂閱檔位綁定。

這會(huì)讓企業(yè)在預(yù)算預(yù)測(cè)上面臨更大不確定性。尤其是那些涉及多次重試、大上下文窗口、多步驟智能體循環(huán)的工作負(fù)載，其 token 消耗可能快速膨脹。

更麻煩的是，Anthropic 的積分是按用戶分配的，不能在團(tuán)隊(duì)之間共享。這意味著企業(yè)無法輕松建立一個(gè)統(tǒng)一預(yù)算池來覆蓋共享自動(dòng)化任務(wù)。一個(gè)失控的智能體，或者一個(gè)設(shè)計(jì)不佳的提示詞，都可能迅速燒光個(gè)人額度，導(dǎo)致任務(wù)中斷或者開始產(chǎn)生額外費(fèi)用。

高額的費(fèi)用讓微軟也有了壓力。據(jù)外媒報(bào)道，微軟已開始逐步取消數(shù)千名內(nèi)部開發(fā)者的 Claude Code 授權(quán)。盡管過去半年這個(gè) AI 編程工具深受微軟員工歡迎，但公司決定將重點(diǎn)收縮至自家的 GitHub Copilot CLI。

微軟向員工解釋說，此舉是為了將 Copilot CLI 作為其在“體驗(yàn)與設(shè)備”領(lǐng)域的主要代理命令行界面工具，但消息人士稱，此舉也與財(cái)務(wù)有關(guān)。6 月 30 日是微軟當(dāng)前財(cái)年的最后一天，取消 Claude Code 許可證是削減運(yùn)營(yíng)開支的簡(jiǎn)便方法，以便在 7 月新財(cái)年開始時(shí)節(jié)省開支。

近幾個(gè)月來，微軟內(nèi)部開發(fā)者更傾向于使用 Claude Code 而非 GitHub Copilot CLI。對(duì)于內(nèi)部員工來說，從 Claude Code 過渡到 GitHub Copilot 并非易事。微軟一直鼓勵(lì)沒有編程經(jīng)驗(yàn)的員工嘗試使用 Claude Code，以便設(shè)計(jì)師和項(xiàng)目經(jīng)理能夠快速構(gòu)建原型。微軟最初還希望員工同時(shí)使用 Claude Code 和 GitHub Copilot，以便比較兩者并提供反饋。

現(xiàn)在，微軟的 GitHub 團(tuán)隊(duì)面臨著巨大的壓力，他們需要改進(jìn) Copilot CLI，并力爭(zhēng)超越 Claude Code。

可以看到，Claude Code 雖然得到了能力認(rèn)可，但一旦價(jià)格超出用戶負(fù)擔(dān)，無論個(gè)人還是企業(yè)，都會(huì)考慮選擇其他產(chǎn)品，這對(duì) Codex、Copilot 們來說，也是一次機(jī)會(huì)。

“算力是我們整個(gè)業(yè)務(wù)的生命線”

擁有更多算力是 Anthropic 最直接的解法。

“我們采購(gòu)的算力，基本就是整個(gè)業(yè)務(wù)的生命線。”Krishna 也在近期參加播客節(jié)目時(shí)表示。

Anthropic 近期大規(guī)模采購(gòu)算力，也說明了這一點(diǎn)。該公司已經(jīng)獨(dú)家租用 SpaceX Colossus 1 超算中心；與 AWS 長(zhǎng)期合作，鎖定 5GW Trainium 算力，10 年投入超 1000 億美元；簽約 Google 與 Broadcom 的下一代 TPU 長(zhǎng)單，3.5GW 算力將從 2027 年起交付。去年，Anthropic 還宣布投入 500 億美元自建美國(guó) AI 基礎(chǔ)設(shè)施，并同步加碼 Google TPU 與 Microsoft Azure 算力。

值得一提的是，Krishna 明確表示，公司內(nèi)部并沒有看到 scaling laws 放緩的跡象。

在 Anthropic 內(nèi)部，scaling laws 的討論也與不同開發(fā)階段密切相關(guān)。Krishna 表示，公司會(huì)看模型在不同開發(fā)階段的表現(xiàn)。比如，在一次預(yù)訓(xùn)練運(yùn)行過程中，Anthropic 可以從損失曲線上看到，這個(gè)模型和之前訓(xùn)練過的模型相比表現(xiàn)怎么樣。這樣一來，公司就能對(duì)模型能力有一個(gè)基本判斷。

在強(qiáng)化學(xué)習(xí)階段，也可以用類似的方式來看。還有一點(diǎn)同樣重要，就是當(dāng)客戶真正拿到模型之后，他們看到了什么、在哪些地方發(fā)現(xiàn)了問題。這些痛點(diǎn)之后就會(huì)變成 Anthropic 的訓(xùn)練目標(biāo)。

當(dāng)然，在企業(yè)側(cè)，Anthropic 不會(huì)用客戶數(shù)據(jù)來訓(xùn)練模型，但客戶會(huì)告訴 Anthropic 一些很具體的反饋。比如：“我希望模型在這個(gè)方面更好”，或者“我在某個(gè)地方被卡住了”，Anthropic 通常會(huì)按這個(gè)方向去做產(chǎn)品，因?yàn)楣緯?huì)在研發(fā)側(cè)持續(xù)推進(jìn)，隨著時(shí)間推移把這些能力提升上來。

所以，這里面其實(shí)形成了一個(gè)相互連接的循環(huán)。在內(nèi)部，Anthropic 會(huì)一直觀察不同訓(xùn)練階段的模型、不同版本的模型快照，把它們和自己的指標(biāo)做比較，也會(huì)和外部模型做一些比較；最終，公司還會(huì)看客戶怎么評(píng)價(jià)這些模型。

Krishna 補(bǔ)充解釋道，Anthropic 確實(shí)非常相信 scaling laws。“當(dāng)然，很多 scaling laws 論文的作者本來就是 Anthropic 的創(chuàng)始人。但即便如此，公司內(nèi)部其實(shí)也是一群帶著懷疑精神的人。至少?gòu)哪壳翱吹降那闆r來看，scaling laws 并沒有放緩。”

因此，單從模型開發(fā)層面，Anthropic 就有動(dòng)力持續(xù)進(jìn)行算力投入，更何況其背后還有眾多用戶。

克制采購(gòu)、大量異構(gòu)算力終于可以快速消化

“對(duì)公司來說，算力是最重要的資源，也是其他一切能力建立起來的基礎(chǔ)。所以，到底要買多少算力，是公司里最關(guān)鍵、也最難做的決策之一。”Krishna 解釋稱，算力買多了，公司可能會(huì)被成本拖垮；算力買少了，又沒辦法服務(wù)客戶，也沒辦法繼續(xù)站在技術(shù)前沿。某種意義上，這兩個(gè)結(jié)果都很危險(xiǎn)。

因此，對(duì) Anthropic 來說，算力采購(gòu)不是一個(gè)可以臨時(shí)拍板的事情，它會(huì)帶來非常現(xiàn)實(shí)的后果。公司不可能今天說要買一吉瓦算力，下周它就交付。很多事情都必須提前規(guī)劃。

據(jù) Krishna 介紹，Anthropic 在思考算力問題時(shí)，會(huì)盡量用一套系統(tǒng)的方法來判斷。公司會(huì)從具體需求往上推，建模型、預(yù)測(cè)未來可能需要多少算力。當(dāng)然，這些預(yù)測(cè)有時(shí)候也會(huì)出錯(cuò)。公司還要判斷，如果想繼續(xù)保持在前沿，到底需要準(zhǔn)備多少算力，并且盡量根據(jù)未來的發(fā)展去估算。

“等到真正去做算力采購(gòu)交易時(shí)，靈活性就非常重要。”Krishna 強(qiáng)調(diào)，Anthropic 會(huì)把這種靈活性寫進(jìn)合同里，也會(huì)體現(xiàn)在后續(xù)使用算力的方式里。因?yàn)楫?dāng)業(yè)務(wù)進(jìn)入指數(shù)級(jí)增長(zhǎng)階段，最關(guān)鍵的就是盡可能高效地使用手里的算力。

“即便到今天，我大概仍然有 30% 到 40% 的時(shí)間花在算力上。”他說道。

在 Anthropic 的語境里，靈活性有好幾層意思。首先，公司不是只押注一種芯片平臺(tái)。現(xiàn)在 Anthropic 同時(shí)使用三類芯片：Amazon 的 Trainium、Google 的 TPU，以及 Nvidia 的 GPU。對(duì)公司來說，這些芯片可以在不同場(chǎng)景里相互替換、靈活調(diào)度。

Anthropic 買來的算力，會(huì)被用在幾類事情上：一類是模型開發(fā)，一類是內(nèi)部使用，比如加速自己的產(chǎn)品和模型研發(fā)，當(dāng)然還有一類是對(duì)外服務(wù)客戶。無論是 Trainium、TPU 還是 GPU，Anthropic 都會(huì)盡量讓它們覆蓋這些內(nèi)部和外部場(chǎng)景，而不是把某一種芯片固定死在某一種用途上。

但這種靈活性不是一開始就有的。Anthropic 花了很多年時(shí)間，持續(xù)投入，才慢慢做到今天這個(gè)程度。Krishna 認(rèn)為，在所有前沿實(shí)驗(yàn)室里，Anthropic 可能是最高效的算力使用者之一。

比如 Anthropic 剛開始用 TPU 的時(shí)候，Krishna 記得大概還是第三代 TPU。那是 Anthropic 第一次大規(guī)模使用 TPU。很多人當(dāng)時(shí)都不理解，覺得：“你們是不是瘋了？大家都在用 GPU，為什么你們不用 GPU？”但 Anthropic 一直很重視這件事，因?yàn)楣镜哪繕?biāo)就是能夠非常靈活地使用各種算力。

除此之外，Anthropic 還會(huì)比較同一芯片平臺(tái)的不同代際，看哪一代芯片最適合哪一種內(nèi)部工作負(fù)載，然后把它放到最合適的位置上。也正因?yàn)檫@樣，公司后來真正搭起了一套編排層。它的作用就是幫 Anthropic 靈活調(diào)度不同類型、不同代際的算力，并在這個(gè)過程中，把每一份算力的價(jià)值盡可能榨出來。

一方面，公司會(huì)貼近底層硬件做優(yōu)化，盡量少被中間軟件層限制，從而控制更多性能變量；另一方面，這也是一個(gè)與各方緊密協(xié)作的過程。比如，Anthropic 和 Amazon 的 Annapurna Labs 團(tuán)隊(duì)合作非常緊密，也會(huì)參與影響這些芯片的路線圖。

因?yàn)?Anthropic 認(rèn)為，公司正在做的事情確實(shí)是在把這些芯片的能力推到極限。這也意味著，在 Anthropic 內(nèi)部，一美元算力所產(chǎn)生的價(jià)值，比在其他任何地方都要更高。

Krishna 坦言，今天在這些使用場(chǎng)景里，Anthropic 其實(shí)都受算力限制。如果放在一兩年前，突然給 Anthropic 一批不同類型的算力，公司確實(shí)很難馬上消化掉。因?yàn)檫@些芯片平臺(tái)彼此不一樣，有些更難操作，有些在使用方式上也有自己的特點(diǎn)。

但今天不一樣了。如果現(xiàn)在給 Anthropic 更多算力，公司會(huì)很快把它部署到不同的使用場(chǎng)景里。整體分配方式可能和今天差不多，但 Anthropic 現(xiàn)在已經(jīng)更擅長(zhǎng)快速啟動(dòng)、快速部署幾乎任何類型的算力。Krishna 認(rèn)為，這也是公司的一個(gè)真正優(yōu)勢(shì)。

性價(jià)比很重要，要把算力拆得非常細(xì)

Anthropic 已經(jīng)宣布與 SpaceX 在 Memphis 的 Colossus 設(shè)施合作。這就是一個(gè)很好的例子，來證明，只要能拿到近期算力（near-term compute），Anthropic 都會(huì)去尋找機(jī)會(huì)。

隨著算力基數(shù)越來越大，這類近期算力在整體可用算力中的占比會(huì)越來越小，但 Anthropic 看它的核心標(biāo)準(zhǔn)是：這些可用算力能不能有效部署起來。

答案有時(shí)候是可以，有時(shí)候是不行。如果可以，Anthropic 就會(huì)繼續(xù)看它的經(jīng)濟(jì)回報(bào)：價(jià)格怎么樣、能用多久、位置在哪里、屬于哪種類型的算力，以及公司能不能高效地運(yùn)行它。所以，Anthropic 內(nèi)部有一套評(píng)估流程。

這套流程也會(huì)用來評(píng)估長(zhǎng)期交易。上個(gè)月，Anthropic 和 Google、Broadcom 簽了一個(gè)五吉瓦的 TPU 合作，從 2027 年開始。Anthropic 也和 Amazon 簽了一個(gè)最高五吉瓦的 Trainium 交易，這是一個(gè)超過 1000 億美元的承諾，其中很多算力其實(shí)已經(jīng)開始落地，并且會(huì)在今明兩年里繼續(xù)落地。

Krishna 將其形容成一層層疊起來的“算力蛋糕”（layer cake）：不同算力會(huì)在不同時(shí)間啟動(dòng)，能力也不一樣，而 Anthropic 會(huì)非常動(dòng)態(tài)地比較這些算力。對(duì)公司來說，算力隨著時(shí)間變化的性價(jià)比非常重要，它什么時(shí)候能落地，以及公司認(rèn)為它能在業(yè)務(wù)內(nèi)部發(fā)揮什么作用，也同樣重要。這里有很多變量需要一起優(yōu)化：它是什么類型的算力、成本是多少、使用周期有多長(zhǎng)等。Anthropic 會(huì)用一套相當(dāng)動(dòng)態(tài)的方式去看近期算力、中期算力和長(zhǎng)期算力。評(píng)估的核心大體相同，只是時(shí)間周期不同。

在評(píng)估算力時(shí)，Anthropic 也會(huì)看每 token 成本、吞吐量和速度之間的取舍。Krishna 提到，當(dāng) Anthropic 同時(shí)看三個(gè)不同芯片平臺(tái)時(shí)，每個(gè)平臺(tái)里面其實(shí)還有不同代際的芯片，比如 TPU V5e、V6、V7，Trainium 2、Trainium 3，它們?cè)谛詢r(jià)比曲線上的位置都不一樣。

接下來很重要的一點(diǎn)，是看公司準(zhǔn)備怎么用這些算力。性價(jià)比當(dāng)然重要，因?yàn)樗苯雨P(guān)系到效率；但對(duì)某些使用場(chǎng)景來說，速度也同樣重要。所以，Anthropic 會(huì)把算力拆得非常細(xì)，細(xì)到它什么時(shí)候能交付、能交付什么能力。

這件事主要由 Anthropic 的算力團(tuán)隊(duì)主導(dǎo)，但整個(gè)公司也會(huì)密切配合，一起討論哪些地方需要這些算力、具體是為了什么。比如，公司可能需要 CPU 來做強(qiáng)化學(xué)習(xí)，也可能需要更前沿的算力來運(yùn)行最好、最快的模型，或者用來訓(xùn)練這些模型。所以，從 Anthropic 的角度看，算力怎么用，既取決于客戶需求，也取決于一個(gè)非常細(xì)的問題：每種芯片最適合做什么，以及公司什么時(shí)候能夠拿到它。

模型開發(fā)有算力保底，內(nèi)部員工的也得給

Anthropic 現(xiàn)在想要達(dá)到的狀態(tài)是：首先仍然要站在前沿，這是最重要的；其次要能夠服務(wù)客戶；同時(shí)還要有足夠的內(nèi)部算力來加速員工推進(jìn)工作。

除了討論怎么買算力，Anthropic 也經(jīng)常開會(huì)討論算力怎么分配。Krishna 認(rèn)為，這套討論方式和公司文化有關(guān)。Anthropic 的文化非常強(qiáng)調(diào)協(xié)作，所以大家討論算力分配時(shí)，也不是各自守著自己的“地盤”，更不是零和博弈，而是用一種非常協(xié)作的方式來推進(jìn)。

但在模型開發(fā)這件事上，Anthropic 會(huì)設(shè)一個(gè)不會(huì)低于的算力底線。也就是說，哪怕這會(huì)讓服務(wù)客戶變得更困難，或者不得不在某些地方采取一些不太常規(guī)的做法，公司仍然會(huì)繼續(xù)做長(zhǎng)期投入，去開發(fā)最好的模型。因?yàn)?Anthropic 認(rèn)為，前沿智能的回報(bào)非常高，尤其是在企業(yè)領(lǐng)域。所以，分配給模型開發(fā)的算力，會(huì)有一個(gè)明確的下限。

而內(nèi)部團(tuán)隊(duì)也會(huì)分走一部分算力。Krishna 提到一個(gè)很有意思的點(diǎn)。如果公司對(duì)員工說，“你們不能再使用我們的模型了”，那么 Anthropic 分配給員工內(nèi)部使用的這些算力，其實(shí)可以支撐數(shù)十億美元的收入。

實(shí)際上，Anthropic 現(xiàn)在內(nèi)部 90% 以上的代碼，其實(shí)都是由 Claude Code 寫的。很多 Claude Code 本身，也是在 Claude Code 的幫助下寫出來的。這一程度上解釋了 Anthropic 為什么要把部分算力留給給內(nèi)部使用，因?yàn)槟Ｐ捅旧碚趲椭?Anthropic 構(gòu)建下一代模型。

Krishna 表示，公司內(nèi)部討論算力分配問題時(shí)，每個(gè)團(tuán)隊(duì)都會(huì)說明：如果拿到這些算力，他們會(huì)用來做什么。接著，大家會(huì)非常開放、坦誠(chéng)地討論這些投入的回報(bào)該怎么看。因?yàn)?Anthropic 可以非常動(dòng)態(tài)地分配算力，所以也能在相對(duì)較短的時(shí)間內(nèi)做出調(diào)整和改變。

這期間，Krishna 還強(qiáng)調(diào)了人的作用。擁有最好模型的人才，可以加速能力發(fā)展。

他解釋稱，Anthropic 其實(shí)不太用“閉源”或“開源”來區(qū)分模型，而是會(huì)把模型分成“在前沿”和“不在前沿”。那些站在前沿的模型，顯然正在捕獲經(jīng)濟(jì)價(jià)值，也在為客戶帶來有意義的投資回報(bào)。Anthropic 現(xiàn)在做的，就是繼續(xù)圍繞這個(gè)判斷加大投入。這既意味著投入算力，也意味著投入那些能夠用好算力、并且能夠用 Anthropic 自己的模型來真正加速開發(fā)的人才。

不只模型，還包括構(gòu)建在模型之上的產(chǎn)品。比如，Anthropic 在一月發(fā)布了三十個(gè)不同的產(chǎn)品和功能。這個(gè)節(jié)奏也在加快。這部分也得益于公司把模型和現(xiàn)有人才結(jié)合起來，讓人們能夠更快、更有效地使用底層智能。這基本上就是 Anthropic 在產(chǎn)品側(cè)的判斷。

Krishna 強(qiáng)調(diào)，Anthropic 的核心仍然是一個(gè)研究實(shí)驗(yàn)室，是那些不斷推動(dòng)模型能力上限的事情。公司一切都建立在這套研究體系之上。

今天，這套研究體系確實(shí)已經(jīng)被模型賦能了，但還不是完全由模型自己完成。隨著時(shí)間推移，Anthropic 認(rèn)為模型會(huì)變得更強(qiáng)，也會(huì)在研究過程中提供更多幫助。但研究方向怎么定、優(yōu)先級(jí)怎么排、哪些新領(lǐng)域值得探索，仍然需要最優(yōu)秀的研究人才來判斷和設(shè)定。模型的加入，是在進(jìn)一步放大這些研究人才的能力。

所以，Krishna 把模型看成一種放大器：它不是取代 Anthropic 已有的人才，而是在強(qiáng)化和加速這些人才。人們經(jīng)常說，人才密度比人才規(guī)模更重要，Krishna 認(rèn)為在這里同樣成立。

Anthropic 真正想要的，是聚集最優(yōu)秀、最密集的一批 AI 研究人才和推理工程人才，再用最好的模型放大他們的能力。Anthropic 認(rèn)為，這會(huì)形成一個(gè)非常有競(jìng)爭(zhēng)力的組合。

算力，不是 Anthropic 的某一項(xiàng)具體成本

Krishna 透露，Anthropic 看算力投入，不會(huì)只看某一項(xiàng)具體成本，而是看整塊算力支出到底能帶來多少回報(bào)。這里說的“整塊”，包括各種用途：服務(wù)客戶、模型開發(fā)、內(nèi)部提效等等。可以把它們理解成在不同時(shí)間尺度上支持收入增長(zhǎng)的事情。

比如，現(xiàn)在用算力做推理，它直接支撐今天的收入；如果把算力用在模型開發(fā)上，它可能會(huì)在六個(gè)月后帶來新的模型能力，打開新的市場(chǎng)空間，進(jìn)而推動(dòng)未來收入增長(zhǎng)；如果把算力用于內(nèi)部提效，幫助團(tuán)隊(duì)更快推出新產(chǎn)品，這本質(zhì)上也在支持收入。

所以，Anthropic 真正看的不是某一筆算力花費(fèi)本身，而是整個(gè)算力池的總體回報(bào)。至少?gòu)慕裉靵砜矗琄rishna 認(rèn)為 Anthropic 在算力上的投入回報(bào)是很穩(wěn)健的。公司一方面要為客戶創(chuàng)造價(jià)值，另一方面也要確保自己能從算力投入中獲得足夠強(qiáng)的回報(bào)。站在這個(gè)角度看，Anthropic 對(duì)目前的位置比較有信心。

再看第一季度的收入增長(zhǎng)，那段時(shí)間收入漲得很快，但并不是因?yàn)?Anthropic 突然上線了一大批新算力。算力通常是按照很早以前就確定好的節(jié)奏逐步到位的，很多時(shí)候這個(gè)節(jié)奏可能在十二個(gè)月前就已經(jīng)定下來了。

所以，在 Krishna 看來，如果把服務(wù)每一個(gè)客戶都簡(jiǎn)單理解成一筆“新增變量成本”，其實(shí)不太適合 Anthropic 的業(yè)務(wù)。那更像是在用傳統(tǒng)軟件公司的邏輯來套它，但真實(shí)情況不是這樣。

他解釋稱，算力不是只對(duì)應(yīng)某一個(gè)客戶、某一項(xiàng)成本，它同時(shí)支撐客戶服務(wù)、模型研發(fā)、內(nèi)部提效等一整套活動(dòng)。而 Anthropic 衡量的核心，就是這整套算力投入到底能不能帶來穩(wěn)健回報(bào)。因此，Anthropic 會(huì)把現(xiàn)有的算力池看成一個(gè)關(guān)鍵約束條件。它決定了公司短期能服務(wù)多少客戶、長(zhǎng)期能推動(dòng)多少模型和產(chǎn)品能力，也決定了最終能帶動(dòng)多少收入。

Amazon、Google、Microsoft 都是 Anthropic 的重要合作伙伴，Broadcom 和 Nvidia 也是如此。Krishna 表示，Anthropic 的生態(tài)系統(tǒng)很強(qiáng)。今天，Anthropic 是唯一一個(gè)同時(shí)出現(xiàn)在三大云上的模型，也是唯一一家使用這三種芯片平臺(tái)的語言模型實(shí)驗(yàn)室。

“這些合作遠(yuǎn)遠(yuǎn)不只是采購(gòu)。”Krishna 認(rèn)為，這一點(diǎn)經(jīng)常被忽視。

比如 Anthropic 和 Amazon 的關(guān)系，Anthropic 的團(tuán)隊(duì)和 Annapurna Labs 團(tuán)隊(duì)是深度綁定在一起的。Anthropic 非常擅長(zhǎng)使用 Trainium，也投入了大量時(shí)間和精力，和 Amazon 團(tuán)隊(duì)密切合作，雙方會(huì)一起做容量規(guī)劃。

“再看三大云，它們對(duì) Anthropic 來說也是非常好的分發(fā)渠道。”Krishna 進(jìn)一步解釋道，“當(dāng)然，Anthropic 自己的一方業(yè)務(wù)也非常強(qiáng)。但總體來看，這些合作關(guān)系都是多維度的，不只是買算力這么簡(jiǎn)單，包括了芯片本身的開發(fā)、容量落地、服務(wù)交付，最后還包括把這些能力分發(fā)給客戶。”

https://www.anthropic.com/research/2028-ai-leadership

https://www.reuters.com/business/retail-consumer/us-clears-h200-chip-sales-10-china-firms-nvidia-ceo-looks-breakthrough-2026-05-14/

https://www.infoworld.com/article/4171274/anthropic-puts-claude-agents-on-a-meter-across-its-subscriptions.html

https://www.theverge.com/tech/930447/microsoft-claude-code-discontinued-notepad

聲明：本文為 AI 前線原創(chuàng)，不代表平臺(tái)觀點(diǎn)，未經(jīng)許可禁止轉(zhuǎn)載。

會(huì)議推薦

Agent 從 Demo 到工程化還差什么？安全與可信這道坎怎么過？研發(fā)體系不重構(gòu)，還能撐多久？

AICon 上海站 2026，13 大重磅專題已上線，誠(chéng)摯邀請(qǐng)你登臺(tái)分享實(shí)戰(zhàn)經(jīng)驗(yàn)。AICon 2026，期待與你同行。快來掃碼鎖定 8 折專屬席位或提交演講議題

今日薦文

你也「在看」嗎？

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.