<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      H200還沒到中國(guó),Anthropic先急了:千億美元搶芯片,轉(zhuǎn)頭漲價(jià)讓開發(fā)者買單

      0
      分享至


      作者 | 褚杏娟

      當(dāng)?shù)貢r(shí)間 5 月 14 日,Anthropic 以中美 AI 競(jìng)爭(zhēng)為由發(fā)布長(zhǎng)文,呼吁進(jìn)一步收緊芯片出口限制。

      同一天稍早時(shí)候,路透社報(bào)道稱,美國(guó)已批準(zhǔn)約 10 家中國(guó)公司購(gòu)買英偉達(dá)專為中國(guó)市場(chǎng)定制的 H200 芯片。報(bào)道提到的公司包括阿里、騰訊、字節(jié)、京東等。不過,這批許可尚未轉(zhuǎn)化為實(shí)際交付。

      Anthropic 直接指出,訓(xùn)練前沿 AI 模型最關(guān)鍵的資源是先進(jìn)芯片,也就是算力。美國(guó)目前的優(yōu)勢(shì)建立在 NVIDIA、AMD、TSMC 等“民主國(guó)家產(chǎn)業(yè)鏈”之上。但如果不進(jìn)一步收緊管制,美國(guó)在 2028 年前可能會(huì)失去主導(dǎo)權(quán),中國(guó) AI 實(shí)驗(yàn)室的模型能力可能追到只落后美國(guó)幾個(gè)月。

      Anthropic 還引用了一組數(shù)據(jù),稱按總處理性能計(jì)算,華為在 2026 年的算力產(chǎn)出僅相當(dāng)于英偉達(dá)的 4%,到 2027 年更是降至 2%。

      在 Anthropic 的框架里,中美 AI 競(jìng)爭(zhēng)被拆解為四條線:第一是智能,即誰能開發(fā)出最強(qiáng)大的 AI 模型;第二是國(guó)內(nèi)采用,即誰能更有效地把 AI 整合進(jìn)商業(yè)和公共部門;第三是全球分發(fā),即誰能部署支撐世界經(jīng)濟(jì)運(yùn)行的全球 AI 技術(shù)棧;第四是韌性,即誰能在 AI 帶來的經(jīng)濟(jì)社會(huì)轉(zhuǎn)型中維持穩(wěn)定和連續(xù)性。

      其中,模型智能被認(rèn)為是最重要的一條,而這也是 Anthropic 收入的重要基石。

      Anthropic 認(rèn)為,當(dāng)前中國(guó) AI 實(shí)驗(yàn)室之所以仍能接近美國(guó)模型能力,主要依靠三類因素:世界級(jí)人才、先進(jìn)算力,以及通過大規(guī)模“蒸餾攻擊”提取其前沿模型能力。為此,Anthropic 還提出,應(yīng)明確將“蒸餾攻擊”非法化,并加強(qiáng)情報(bào)共享;同時(shí)推動(dòng)美國(guó)“可信 AI 技術(shù)棧”出口,搶占全球南方市場(chǎng)。

      一邊阻止先進(jìn)芯片外流,Anthropic 一邊正在斥巨資解決自身面臨的巨大算力短缺問題,同時(shí)通過頻繁調(diào)整產(chǎn)品價(jià)格,讓用戶來承擔(dān)算力短缺帶來的影響。

      又又又調(diào)價(jià),開發(fā)者氣瘋了

      在算力持續(xù)緊張的背景下,Anthropic 再一次調(diào)整了定價(jià)策略。

      近日,Anthropic 宣布,從 6 月 15 日起,將把程序化 Claude 使用量與標(biāo)準(zhǔn)聊天訂閱額度拆分開來。也就是說,開發(fā)者通過 Agent SDK、GitHub Actions,以及 OpenClaw 等第三方智能體框架調(diào)用 Claude 時(shí),將不再簡(jiǎn)單計(jì)入原有訂閱套餐,而是進(jìn)入一個(gè)獨(dú)立的月度積分系統(tǒng),并按照類似 API 的方式計(jì)費(fèi)。

      這一變化意味著,過去許多開發(fā)者用 Claude Pro 或 Max 套餐低成本運(yùn)行自動(dòng)化任務(wù)、智能體腳本、CI 流水線和長(zhǎng)期編碼代理的方式,將面臨重新定價(jià)。

      根據(jù) Anthropic 的安排,程序化使用的月度積分額度將與用戶現(xiàn)有 Claude 訂閱檔位掛鉤,大體對(duì)應(yīng)其月費(fèi)水平。其中,Pro 用戶每月可獲得 20 美元積分,Max 5x 用戶為 100 美元,Max 20x 用戶為 200 美元。

      在此之前,Claude 的交互式聊天使用和程序化調(diào)用來自同一個(gè)訂閱額度池。開發(fā)者不僅可以用高階 Claude 套餐進(jìn)行聊天、寫代碼、調(diào)試,也可以通過外部智能體框架運(yùn)行自動(dòng)化工作流。

      正是這種“一個(gè)訂閱覆蓋多種用途”的模式,讓 Claude 一度成為智能體開發(fā)者眼中的高性價(jià)比選擇。尤其對(duì)于運(yùn)行長(zhǎng)期任務(wù)的開發(fā)者來說,通過 OpenClaw、Agent SDK 等工具調(diào)用 Claude,實(shí)際成本往往低于直接使用 API。

      但 Anthropic 早在今年 4 月就已經(jīng)釋放信號(hào)。公司當(dāng)時(shí)在 X 上表示,Claude 訂閱將“不再覆蓋 OpenClaw 等第三方工具的使用量”,理由是算力容量受限。新政策落地后,開發(fā)者如果繼續(xù)使用外部智能體框架,要么購(gòu)買額外用量包,要么轉(zhuǎn)向直接 API 計(jì)費(fèi)。

      有趣的是,Anthropic 首席財(cái)務(wù)官 Krishna Rao 在采訪中表示,“我們的定價(jià)一直比較穩(wěn)定。無論是 Haiku、Sonnet,還是 Opus,價(jià)格都沒有頻繁調(diào)整。現(xiàn)在 Mythos 當(dāng)然是比較新的模型,但總體來說,Anthropic 很少改價(jià)格。過去最大的一次價(jià)格調(diào)整,是在推出 Opus 4.5 時(shí),公司把 Opus 系列的價(jià)格降了下來。”

      他解釋當(dāng)時(shí)的降價(jià)的原因在于,Anthropic 發(fā)現(xiàn) Opus 級(jí)模型的能力很強(qiáng),但實(shí)際使用量沒有完全匹配它的能力。很多客戶明明遇到的是一個(gè)適合用 Opus 解決的問題,卻會(huì)想辦法把它塞進(jìn) Sonnet 的工作負(fù)載里。后來,由于模型效率上又有提升,從 Anthropic 的角度看,已經(jīng)可以更高效地運(yùn)行 Opus,于是公司就把價(jià)格降下來,讓客戶更容易用上它。

      這又回到一個(gè)核心點(diǎn):Anthropic 希望用戶使用自己的模型,這也價(jià)格必須設(shè)在一個(gè)用戶可以接受、并且能夠從中獲得足夠價(jià)值的位置上。

      Krishna 認(rèn)為,“Opus 這次降價(jià),其實(shí)體現(xiàn)了杰文斯悖論:Anthropic 把價(jià)格降了下來,但使用量的增長(zhǎng)遠(yuǎn)遠(yuǎn)超過原本預(yù)期。也就是說,因?yàn)閮r(jià)格落到了客戶覺得合適的位置,他們開始更大量地使用 Opus。而 Anthropic 也有足夠的效率,可以支撐這種大規(guī)模使用。等客戶把它真正接入自己的工作流之后,Anthropic 再發(fā)布 Opus 4.6,它就是一次模型升級(jí),客戶可以直接替換進(jìn)去,而價(jià)格不需要再變。”

      Krishna 強(qiáng)調(diào)定價(jià)穩(wěn)定很重要,但實(shí)際上,用戶對(duì)價(jià)格有很強(qiáng)的敏感度,很反感 Anthropic 一而再再而三地調(diào)整價(jià)格策略。

      如之前調(diào)整一樣,最新調(diào)整很快就引發(fā)了開發(fā)者不滿。許多人認(rèn)為,Anthropic 正在削弱 Claude 對(duì)智能體工作流最有吸引力的一點(diǎn):用相對(duì)穩(wěn)定、可預(yù)測(cè)的訂閱價(jià)格,支撐大規(guī)模自動(dòng)化任務(wù)。

      高級(jí)數(shù)據(jù)科學(xué)家 Yadesh Salvi 在 X 上批評(píng)稱,Anthropic 提供的月度額度“連一天的認(rèn)真工作都撐不過去”。他認(rèn)為,Claude Agent SDK 和 Claude Code 中的claude -p等功能原本是用戶高頻使用的核心能力,如今卻被壓縮使用空間,還被包裝成訂閱福利。

      Broadcom 高級(jí)站點(diǎn)可靠性工程師 Advait Patel 也表示,對(duì)于那些基于 Claude Pro 或 Max 固定價(jià)格套餐構(gòu)建副業(yè)項(xiàng)目和個(gè)人自動(dòng)化工具的開發(fā)者來說,新的獨(dú)立積分池確實(shí)能給開發(fā)者一點(diǎn)試驗(yàn)空間,但一旦智能體足夠有用、需要頻繁運(yùn)行,開發(fā)者就不可避免地進(jìn)入按量計(jì)費(fèi)模式。


      “重度智能體用戶消耗的算力,遠(yuǎn)遠(yuǎn)超過 20 美元或 100 美元訂閱能夠支撐的范圍。”Patel 認(rèn)為,運(yùn)行大模型本身確實(shí)昂貴,面向程序化使用的無限固定價(jià)格套餐,本來就很難長(zhǎng)期持續(xù)。同樣的錢,能跑的自動(dòng)化任務(wù)變少了,想保持原來的使用強(qiáng)度,就要額外付費(fèi)。

      這場(chǎng)定價(jià)變化影響的不只是個(gè)人開發(fā)者,也會(huì)給企業(yè)帶來新的成本管理問題。Patel 指出,過去一些團(tuán)隊(duì)會(huì)依賴 Claude 訂閱運(yùn)行無人值守工作流,例如 CI 流水線、定時(shí)自動(dòng)化任務(wù)和長(zhǎng)時(shí)間運(yùn)行的編碼智能體。但在新政策下,使用量將更直接地與 token 消耗綁定,而不是簡(jiǎn)單跟訂閱檔位綁定。

      這會(huì)讓企業(yè)在預(yù)算預(yù)測(cè)上面臨更大不確定性。尤其是那些涉及多次重試、大上下文窗口、多步驟智能體循環(huán)的工作負(fù)載,其 token 消耗可能快速膨脹。

      更麻煩的是,Anthropic 的積分是按用戶分配的,不能在團(tuán)隊(duì)之間共享。這意味著企業(yè)無法輕松建立一個(gè)統(tǒng)一預(yù)算池來覆蓋共享自動(dòng)化任務(wù)。一個(gè)失控的智能體,或者一個(gè)設(shè)計(jì)不佳的提示詞,都可能迅速燒光個(gè)人額度,導(dǎo)致任務(wù)中斷或者開始產(chǎn)生額外費(fèi)用。


      高額的費(fèi)用讓微軟也有了壓力。據(jù)外媒報(bào)道,微軟已開始逐步取消數(shù)千名內(nèi)部開發(fā)者的 Claude Code 授權(quán)。盡管過去半年這個(gè) AI 編程工具深受微軟員工歡迎,但公司決定將重點(diǎn)收縮至自家的 GitHub Copilot CLI。

      微軟向員工解釋說,此舉是為了將 Copilot CLI 作為其在“體驗(yàn)與設(shè)備”領(lǐng)域的主要代理命令行界面工具,但消息人士稱,此舉也與財(cái)務(wù)有關(guān)。6 月 30 日是微軟當(dāng)前財(cái)年的最后一天,取消 Claude Code 許可證是削減運(yùn)營(yíng)開支的簡(jiǎn)便方法,以便在 7 月新財(cái)年開始時(shí)節(jié)省開支。

      近幾個(gè)月來,微軟內(nèi)部開發(fā)者更傾向于使用 Claude Code 而非 GitHub Copilot CLI。對(duì)于內(nèi)部員工來說,從 Claude Code 過渡到 GitHub Copilot 并非易事。微軟一直鼓勵(lì)沒有編程經(jīng)驗(yàn)的員工嘗試使用 Claude Code,以便設(shè)計(jì)師和項(xiàng)目經(jīng)理能夠快速構(gòu)建原型。微軟最初還希望員工同時(shí)使用 Claude Code 和 GitHub Copilot,以便比較兩者并提供反饋。

      現(xiàn)在,微軟的 GitHub 團(tuán)隊(duì)面臨著巨大的壓力,他們需要改進(jìn) Copilot CLI,并力爭(zhēng)超越 Claude Code。

      可以看到,Claude Code 雖然得到了能力認(rèn)可,但一旦價(jià)格超出用戶負(fù)擔(dān),無論個(gè)人還是企業(yè),都會(huì)考慮選擇其他產(chǎn)品,這對(duì) Codex、Copilot 們來說,也是一次機(jī)會(huì)。

      “算力是我們整個(gè)業(yè)務(wù)的生命線”

      擁有更多算力是 Anthropic 最直接的解法。

      “我們采購(gòu)的算力,基本就是整個(gè)業(yè)務(wù)的生命線。”Krishna 也在近期參加播客節(jié)目時(shí)表示。

      Anthropic 近期大規(guī)模采購(gòu)算力,也說明了這一點(diǎn)。該公司已經(jīng)獨(dú)家租用 SpaceX Colossus 1 超算中心;與 AWS 長(zhǎng)期合作,鎖定 5GW Trainium 算力,10 年投入超 1000 億美元;簽約 Google 與 Broadcom 的下一代 TPU 長(zhǎng)單,3.5GW 算力將從 2027 年起交付。去年,Anthropic 還宣布投入 500 億美元自建美國(guó) AI 基礎(chǔ)設(shè)施,并同步加碼 Google TPU 與 Microsoft Azure 算力。

      值得一提的是,Krishna 明確表示,公司內(nèi)部并沒有看到 scaling laws 放緩的跡象。

      在 Anthropic 內(nèi)部,scaling laws 的討論也與不同開發(fā)階段密切相關(guān)。Krishna 表示,公司會(huì)看模型在不同開發(fā)階段的表現(xiàn)。比如,在一次預(yù)訓(xùn)練運(yùn)行過程中,Anthropic 可以從損失曲線上看到,這個(gè)模型和之前訓(xùn)練過的模型相比表現(xiàn)怎么樣。這樣一來,公司就能對(duì)模型能力有一個(gè)基本判斷。

      在強(qiáng)化學(xué)習(xí)階段,也可以用類似的方式來看。還有一點(diǎn)同樣重要,就是當(dāng)客戶真正拿到模型之后,他們看到了什么、在哪些地方發(fā)現(xiàn)了問題。這些痛點(diǎn)之后就會(huì)變成 Anthropic 的訓(xùn)練目標(biāo)。

      當(dāng)然,在企業(yè)側(cè),Anthropic 不會(huì)用客戶數(shù)據(jù)來訓(xùn)練模型,但客戶會(huì)告訴 Anthropic 一些很具體的反饋。比如:“我希望模型在這個(gè)方面更好”,或者“我在某個(gè)地方被卡住了”,Anthropic 通常會(huì)按這個(gè)方向去做產(chǎn)品,因?yàn)楣緯?huì)在研發(fā)側(cè)持續(xù)推進(jìn),隨著時(shí)間推移把這些能力提升上來。

      所以,這里面其實(shí)形成了一個(gè)相互連接的循環(huán)。在內(nèi)部,Anthropic 會(huì)一直觀察不同訓(xùn)練階段的模型、不同版本的模型快照,把它們和自己的指標(biāo)做比較,也會(huì)和外部模型做一些比較;最終,公司還會(huì)看客戶怎么評(píng)價(jià)這些模型。

      Krishna 補(bǔ)充解釋道,Anthropic 確實(shí)非常相信 scaling laws。“當(dāng)然,很多 scaling laws 論文的作者本來就是 Anthropic 的創(chuàng)始人。但即便如此,公司內(nèi)部其實(shí)也是一群帶著懷疑精神的人。至少?gòu)哪壳翱吹降那闆r來看,scaling laws 并沒有放緩。”

      因此,單從模型開發(fā)層面,Anthropic 就有動(dòng)力持續(xù)進(jìn)行算力投入,更何況其背后還有眾多用戶。

      克制采購(gòu)、大量異構(gòu)算力終于可以快速消化

      “對(duì)公司來說,算力是最重要的資源,也是其他一切能力建立起來的基礎(chǔ)。所以,到底要買多少算力,是公司里最關(guān)鍵、也最難做的決策之一。”Krishna 解釋稱,算力買多了,公司可能會(huì)被成本拖垮;算力買少了,又沒辦法服務(wù)客戶,也沒辦法繼續(xù)站在技術(shù)前沿。某種意義上,這兩個(gè)結(jié)果都很危險(xiǎn)。

      因此,對(duì) Anthropic 來說,算力采購(gòu)不是一個(gè)可以臨時(shí)拍板的事情,它會(huì)帶來非常現(xiàn)實(shí)的后果。公司不可能今天說要買一吉瓦算力,下周它就交付。很多事情都必須提前規(guī)劃。

      據(jù) Krishna 介紹,Anthropic 在思考算力問題時(shí),會(huì)盡量用一套系統(tǒng)的方法來判斷。公司會(huì)從具體需求往上推,建模型、預(yù)測(cè)未來可能需要多少算力。當(dāng)然,這些預(yù)測(cè)有時(shí)候也會(huì)出錯(cuò)。公司還要判斷,如果想繼續(xù)保持在前沿,到底需要準(zhǔn)備多少算力,并且盡量根據(jù)未來的發(fā)展去估算。

      “等到真正去做算力采購(gòu)交易時(shí),靈活性就非常重要。”Krishna 強(qiáng)調(diào),Anthropic 會(huì)把這種靈活性寫進(jìn)合同里,也會(huì)體現(xiàn)在后續(xù)使用算力的方式里。因?yàn)楫?dāng)業(yè)務(wù)進(jìn)入指數(shù)級(jí)增長(zhǎng)階段,最關(guān)鍵的就是盡可能高效地使用手里的算力。

      “即便到今天,我大概仍然有 30% 到 40% 的時(shí)間花在算力上。”他說道。

      在 Anthropic 的語境里,靈活性有好幾層意思。首先,公司不是只押注一種芯片平臺(tái)。現(xiàn)在 Anthropic 同時(shí)使用三類芯片:Amazon 的 Trainium、Google 的 TPU,以及 Nvidia 的 GPU。對(duì)公司來說,這些芯片可以在不同場(chǎng)景里相互替換、靈活調(diào)度。

      Anthropic 買來的算力,會(huì)被用在幾類事情上:一類是模型開發(fā),一類是內(nèi)部使用,比如加速自己的產(chǎn)品和模型研發(fā),當(dāng)然還有一類是對(duì)外服務(wù)客戶。無論是 Trainium、TPU 還是 GPU,Anthropic 都會(huì)盡量讓它們覆蓋這些內(nèi)部和外部場(chǎng)景,而不是把某一種芯片固定死在某一種用途上。

      但這種靈活性不是一開始就有的。Anthropic 花了很多年時(shí)間,持續(xù)投入,才慢慢做到今天這個(gè)程度。Krishna 認(rèn)為,在所有前沿實(shí)驗(yàn)室里,Anthropic 可能是最高效的算力使用者之一。

      比如 Anthropic 剛開始用 TPU 的時(shí)候,Krishna 記得大概還是第三代 TPU。那是 Anthropic 第一次大規(guī)模使用 TPU。很多人當(dāng)時(shí)都不理解,覺得:“你們是不是瘋了?大家都在用 GPU,為什么你們不用 GPU?”但 Anthropic 一直很重視這件事,因?yàn)楣镜哪繕?biāo)就是能夠非常靈活地使用各種算力。

      除此之外,Anthropic 還會(huì)比較同一芯片平臺(tái)的不同代際,看哪一代芯片最適合哪一種內(nèi)部工作負(fù)載,然后把它放到最合適的位置上。也正因?yàn)檫@樣,公司后來真正搭起了一套編排層。它的作用就是幫 Anthropic 靈活調(diào)度不同類型、不同代際的算力,并在這個(gè)過程中,把每一份算力的價(jià)值盡可能榨出來。

      一方面,公司會(huì)貼近底層硬件做優(yōu)化,盡量少被中間軟件層限制,從而控制更多性能變量;另一方面,這也是一個(gè)與各方緊密協(xié)作的過程。比如,Anthropic 和 Amazon 的 Annapurna Labs 團(tuán)隊(duì)合作非常緊密,也會(huì)參與影響這些芯片的路線圖。

      因?yàn)?Anthropic 認(rèn)為,公司正在做的事情確實(shí)是在把這些芯片的能力推到極限。這也意味著,在 Anthropic 內(nèi)部,一美元算力所產(chǎn)生的價(jià)值,比在其他任何地方都要更高。

      Krishna 坦言,今天在這些使用場(chǎng)景里,Anthropic 其實(shí)都受算力限制。如果放在一兩年前,突然給 Anthropic 一批不同類型的算力,公司確實(shí)很難馬上消化掉。因?yàn)檫@些芯片平臺(tái)彼此不一樣,有些更難操作,有些在使用方式上也有自己的特點(diǎn)。

      但今天不一樣了。如果現(xiàn)在給 Anthropic 更多算力,公司會(huì)很快把它部署到不同的使用場(chǎng)景里。整體分配方式可能和今天差不多,但 Anthropic 現(xiàn)在已經(jīng)更擅長(zhǎng)快速啟動(dòng)、快速部署幾乎任何類型的算力。Krishna 認(rèn)為,這也是公司的一個(gè)真正優(yōu)勢(shì)。

      性價(jià)比很重要,要把算力拆得非常細(xì)

      Anthropic 已經(jīng)宣布與 SpaceX 在 Memphis 的 Colossus 設(shè)施合作。這就是一個(gè)很好的例子,來證明,只要能拿到近期算力(near-term compute),Anthropic 都會(huì)去尋找機(jī)會(huì)。

      隨著算力基數(shù)越來越大,這類近期算力在整體可用算力中的占比會(huì)越來越小,但 Anthropic 看它的核心標(biāo)準(zhǔn)是:這些可用算力能不能有效部署起來。

      答案有時(shí)候是可以,有時(shí)候是不行。如果可以,Anthropic 就會(huì)繼續(xù)看它的經(jīng)濟(jì)回報(bào):價(jià)格怎么樣、能用多久、位置在哪里、屬于哪種類型的算力,以及公司能不能高效地運(yùn)行它。所以,Anthropic 內(nèi)部有一套評(píng)估流程。

      這套流程也會(huì)用來評(píng)估長(zhǎng)期交易。上個(gè)月,Anthropic 和 Google、Broadcom 簽了一個(gè)五吉瓦的 TPU 合作,從 2027 年開始。Anthropic 也和 Amazon 簽了一個(gè)最高五吉瓦的 Trainium 交易,這是一個(gè)超過 1000 億美元的承諾,其中很多算力其實(shí)已經(jīng)開始落地,并且會(huì)在今明兩年里繼續(xù)落地。

      Krishna 將其形容成一層層疊起來的“算力蛋糕”(layer cake):不同算力會(huì)在不同時(shí)間啟動(dòng),能力也不一樣,而 Anthropic 會(huì)非常動(dòng)態(tài)地比較這些算力。對(duì)公司來說,算力隨著時(shí)間變化的性價(jià)比非常重要,它什么時(shí)候能落地,以及公司認(rèn)為它能在業(yè)務(wù)內(nèi)部發(fā)揮什么作用,也同樣重要。這里有很多變量需要一起優(yōu)化:它是什么類型的算力、成本是多少、使用周期有多長(zhǎng)等。Anthropic 會(huì)用一套相當(dāng)動(dòng)態(tài)的方式去看近期算力、中期算力和長(zhǎng)期算力。評(píng)估的核心大體相同,只是時(shí)間周期不同。

      在評(píng)估算力時(shí),Anthropic 也會(huì)看每 token 成本、吞吐量和速度之間的取舍。Krishna 提到,當(dāng) Anthropic 同時(shí)看三個(gè)不同芯片平臺(tái)時(shí),每個(gè)平臺(tái)里面其實(shí)還有不同代際的芯片,比如 TPU V5e、V6、V7,Trainium 2、Trainium 3,它們?cè)谛詢r(jià)比曲線上的位置都不一樣。

      接下來很重要的一點(diǎn),是看公司準(zhǔn)備怎么用這些算力。性價(jià)比當(dāng)然重要,因?yàn)樗苯雨P(guān)系到效率;但對(duì)某些使用場(chǎng)景來說,速度也同樣重要。所以,Anthropic 會(huì)把算力拆得非常細(xì),細(xì)到它什么時(shí)候能交付、能交付什么能力。

      這件事主要由 Anthropic 的算力團(tuán)隊(duì)主導(dǎo),但整個(gè)公司也會(huì)密切配合,一起討論哪些地方需要這些算力、具體是為了什么。比如,公司可能需要 CPU 來做強(qiáng)化學(xué)習(xí),也可能需要更前沿的算力來運(yùn)行最好、最快的模型,或者用來訓(xùn)練這些模型。所以,從 Anthropic 的角度看,算力怎么用,既取決于客戶需求,也取決于一個(gè)非常細(xì)的問題:每種芯片最適合做什么,以及公司什么時(shí)候能夠拿到它。

      模型開發(fā)有算力保底,內(nèi)部員工的也得給

      Anthropic 現(xiàn)在想要達(dá)到的狀態(tài)是:首先仍然要站在前沿,這是最重要的;其次要能夠服務(wù)客戶;同時(shí)還要有足夠的內(nèi)部算力來加速員工推進(jìn)工作。

      除了討論怎么買算力,Anthropic 也經(jīng)常開會(huì)討論算力怎么分配。Krishna 認(rèn)為,這套討論方式和公司文化有關(guān)。Anthropic 的文化非常強(qiáng)調(diào)協(xié)作,所以大家討論算力分配時(shí),也不是各自守著自己的“地盤”,更不是零和博弈,而是用一種非常協(xié)作的方式來推進(jìn)。

      但在模型開發(fā)這件事上,Anthropic 會(huì)設(shè)一個(gè)不會(huì)低于的算力底線。也就是說,哪怕這會(huì)讓服務(wù)客戶變得更困難,或者不得不在某些地方采取一些不太常規(guī)的做法,公司仍然會(huì)繼續(xù)做長(zhǎng)期投入,去開發(fā)最好的模型。因?yàn)?Anthropic 認(rèn)為,前沿智能的回報(bào)非常高,尤其是在企業(yè)領(lǐng)域。所以,分配給模型開發(fā)的算力,會(huì)有一個(gè)明確的下限。

      而內(nèi)部團(tuán)隊(duì)也會(huì)分走一部分算力。Krishna 提到一個(gè)很有意思的點(diǎn)。如果公司對(duì)員工說,“你們不能再使用我們的模型了”,那么 Anthropic 分配給員工內(nèi)部使用的這些算力,其實(shí)可以支撐數(shù)十億美元的收入。

      實(shí)際上,Anthropic 現(xiàn)在內(nèi)部 90% 以上的代碼,其實(shí)都是由 Claude Code 寫的。很多 Claude Code 本身,也是在 Claude Code 的幫助下寫出來的。這一程度上解釋了 Anthropic 為什么要把部分算力留給給內(nèi)部使用,因?yàn)槟P捅旧碚趲椭?Anthropic 構(gòu)建下一代模型。

      Krishna 表示,公司內(nèi)部討論算力分配問題時(shí),每個(gè)團(tuán)隊(duì)都會(huì)說明:如果拿到這些算力,他們會(huì)用來做什么。接著,大家會(huì)非常開放、坦誠(chéng)地討論這些投入的回報(bào)該怎么看。因?yàn)?Anthropic 可以非常動(dòng)態(tài)地分配算力,所以也能在相對(duì)較短的時(shí)間內(nèi)做出調(diào)整和改變。

      這期間,Krishna 還強(qiáng)調(diào)了人的作用。擁有最好模型的人才,可以加速能力發(fā)展。

      他解釋稱,Anthropic 其實(shí)不太用“閉源”或“開源”來區(qū)分模型,而是會(huì)把模型分成“在前沿”和“不在前沿”。那些站在前沿的模型,顯然正在捕獲經(jīng)濟(jì)價(jià)值,也在為客戶帶來有意義的投資回報(bào)。Anthropic 現(xiàn)在做的,就是繼續(xù)圍繞這個(gè)判斷加大投入。這既意味著投入算力,也意味著投入那些能夠用好算力、并且能夠用 Anthropic 自己的模型來真正加速開發(fā)的人才。

      不只模型,還包括構(gòu)建在模型之上的產(chǎn)品。比如,Anthropic 在一月發(fā)布了三十個(gè)不同的產(chǎn)品和功能。這個(gè)節(jié)奏也在加快。這部分也得益于公司把模型和現(xiàn)有人才結(jié)合起來,讓人們能夠更快、更有效地使用底層智能。這基本上就是 Anthropic 在產(chǎn)品側(cè)的判斷。

      Krishna 強(qiáng)調(diào),Anthropic 的核心仍然是一個(gè)研究實(shí)驗(yàn)室,是那些不斷推動(dòng)模型能力上限的事情。公司一切都建立在這套研究體系之上。

      今天,這套研究體系確實(shí)已經(jīng)被模型賦能了,但還不是完全由模型自己完成。隨著時(shí)間推移,Anthropic 認(rèn)為模型會(huì)變得更強(qiáng),也會(huì)在研究過程中提供更多幫助。但研究方向怎么定、優(yōu)先級(jí)怎么排、哪些新領(lǐng)域值得探索,仍然需要最優(yōu)秀的研究人才來判斷和設(shè)定。模型的加入,是在進(jìn)一步放大這些研究人才的能力。

      所以,Krishna 把模型看成一種放大器:它不是取代 Anthropic 已有的人才,而是在強(qiáng)化和加速這些人才。人們經(jīng)常說,人才密度比人才規(guī)模更重要,Krishna 認(rèn)為在這里同樣成立。

      Anthropic 真正想要的,是聚集最優(yōu)秀、最密集的一批 AI 研究人才和推理工程人才,再用最好的模型放大他們的能力。Anthropic 認(rèn)為,這會(huì)形成一個(gè)非常有競(jìng)爭(zhēng)力的組合。

      算力,不是 Anthropic 的某一項(xiàng)具體成本

      Krishna 透露,Anthropic 看算力投入,不會(huì)只看某一項(xiàng)具體成本,而是看整塊算力支出到底能帶來多少回報(bào)。這里說的“整塊”,包括各種用途:服務(wù)客戶、模型開發(fā)、內(nèi)部提效等等。可以把它們理解成在不同時(shí)間尺度上支持收入增長(zhǎng)的事情。

      比如,現(xiàn)在用算力做推理,它直接支撐今天的收入;如果把算力用在模型開發(fā)上,它可能會(huì)在六個(gè)月后帶來新的模型能力,打開新的市場(chǎng)空間,進(jìn)而推動(dòng)未來收入增長(zhǎng);如果把算力用于內(nèi)部提效,幫助團(tuán)隊(duì)更快推出新產(chǎn)品,這本質(zhì)上也在支持收入。

      所以,Anthropic 真正看的不是某一筆算力花費(fèi)本身,而是整個(gè)算力池的總體回報(bào)。至少?gòu)慕裉靵砜矗琄rishna 認(rèn)為 Anthropic 在算力上的投入回報(bào)是很穩(wěn)健的。公司一方面要為客戶創(chuàng)造價(jià)值,另一方面也要確保自己能從算力投入中獲得足夠強(qiáng)的回報(bào)。站在這個(gè)角度看,Anthropic 對(duì)目前的位置比較有信心。

      再看第一季度的收入增長(zhǎng),那段時(shí)間收入漲得很快,但并不是因?yàn)?Anthropic 突然上線了一大批新算力。算力通常是按照很早以前就確定好的節(jié)奏逐步到位的,很多時(shí)候這個(gè)節(jié)奏可能在十二個(gè)月前就已經(jīng)定下來了。

      所以,在 Krishna 看來,如果把服務(wù)每一個(gè)客戶都簡(jiǎn)單理解成一筆“新增變量成本”,其實(shí)不太適合 Anthropic 的業(yè)務(wù)。那更像是在用傳統(tǒng)軟件公司的邏輯來套它,但真實(shí)情況不是這樣。

      他解釋稱,算力不是只對(duì)應(yīng)某一個(gè)客戶、某一項(xiàng)成本,它同時(shí)支撐客戶服務(wù)、模型研發(fā)、內(nèi)部提效等一整套活動(dòng)。而 Anthropic 衡量的核心,就是這整套算力投入到底能不能帶來穩(wěn)健回報(bào)。因此,Anthropic 會(huì)把現(xiàn)有的算力池看成一個(gè)關(guān)鍵約束條件。它決定了公司短期能服務(wù)多少客戶、長(zhǎng)期能推動(dòng)多少模型和產(chǎn)品能力,也決定了最終能帶動(dòng)多少收入。

      Amazon、Google、Microsoft 都是 Anthropic 的重要合作伙伴,Broadcom 和 Nvidia 也是如此。Krishna 表示,Anthropic 的生態(tài)系統(tǒng)很強(qiáng)。今天,Anthropic 是唯一一個(gè)同時(shí)出現(xiàn)在三大云上的模型,也是唯一一家使用這三種芯片平臺(tái)的語言模型實(shí)驗(yàn)室。

      “這些合作遠(yuǎn)遠(yuǎn)不只是采購(gòu)。”Krishna 認(rèn)為,這一點(diǎn)經(jīng)常被忽視。

      比如 Anthropic 和 Amazon 的關(guān)系,Anthropic 的團(tuán)隊(duì)和 Annapurna Labs 團(tuán)隊(duì)是深度綁定在一起的。Anthropic 非常擅長(zhǎng)使用 Trainium,也投入了大量時(shí)間和精力,和 Amazon 團(tuán)隊(duì)密切合作,雙方會(huì)一起做容量規(guī)劃。

      “再看三大云,它們對(duì) Anthropic 來說也是非常好的分發(fā)渠道。”Krishna 進(jìn)一步解釋道,“當(dāng)然,Anthropic 自己的一方業(yè)務(wù)也非常強(qiáng)。但總體來看,這些合作關(guān)系都是多維度的,不只是買算力這么簡(jiǎn)單,包括了芯片本身的開發(fā)、容量落地、服務(wù)交付,最后還包括把這些能力分發(fā)給客戶。”

      https://www.anthropic.com/research/2028-ai-leadership

      https://www.reuters.com/business/retail-consumer/us-clears-h200-chip-sales-10-china-firms-nvidia-ceo-looks-breakthrough-2026-05-14/

      https://www.infoworld.com/article/4171274/anthropic-puts-claude-agents-on-a-meter-across-its-subscriptions.html

      https://www.theverge.com/tech/930447/microsoft-claude-code-discontinued-notepad

      聲明:本文為 AI 前線原創(chuàng),不代表平臺(tái)觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。

      會(huì)議推薦

      Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發(fā)體系不重構(gòu),還能撐多久?

      AICon 上海站 2026,13 大重磅專題已上線,誠(chéng)摯邀請(qǐng)你登臺(tái)分享實(shí)戰(zhàn)經(jīng)驗(yàn)。AICon 2026,期待與你同行。快來掃碼鎖定 8 折專屬席位或提交演講議題

      今日薦文


      你也「在看」嗎?

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      破防!阿森納奪冠夜現(xiàn)悲情一幕,3 人陪跑無獎(jiǎng)牌

      破防!阿森納奪冠夜現(xiàn)悲情一幕,3 人陪跑無獎(jiǎng)牌

      一隅非生
      2026-05-20 07:06:11
      吉利新車官宣:5月19日,正式上市!

      吉利新車官宣:5月19日,正式上市!

      科技堡壘
      2026-05-19 09:50:17
      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實(shí)情

      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實(shí)情

      健康科普365
      2026-05-09 21:05:04
      廣州常住人口首破1900萬背后:白云番禺領(lǐng)漲,三區(qū)負(fù)增長(zhǎng)

      廣州常住人口首破1900萬背后:白云番禺領(lǐng)漲,三區(qū)負(fù)增長(zhǎng)

      南方都市報(bào)
      2026-05-19 16:50:51
      一聲槍響,全球震動(dòng)!特朗普高調(diào)宣布:斬首成功,我們擊斃了他!

      一聲槍響,全球震動(dòng)!特朗普高調(diào)宣布:斬首成功,我們擊斃了他!

      鐵血江湖人
      2026-05-20 02:58:29
      京東官宣今年618從5月30日晚8點(diǎn)開始,未來有望實(shí)現(xiàn)包裹全流程無人配送直達(dá)用戶手中

      京東官宣今年618從5月30日晚8點(diǎn)開始,未來有望實(shí)現(xiàn)包裹全流程無人配送直達(dá)用戶手中

      極目新聞
      2026-05-18 16:25:23
      侵犯公民人身自由國(guó)家賠償金,最新標(biāo)準(zhǔn)公布

      侵犯公民人身自由國(guó)家賠償金,最新標(biāo)準(zhǔn)公布

      南方都市報(bào)
      2026-05-19 14:45:00
      特斯拉放棄印度建廠

      特斯拉放棄印度建廠

      新浪財(cái)經(jīng)
      2026-05-19 16:29:08
      塔帥擊碎質(zhì)疑 執(zhí)教7年終登頂英超 復(fù)制溫格足跡 44歲奪冠緊追穆帥

      塔帥擊碎質(zhì)疑 執(zhí)教7年終登頂英超 復(fù)制溫格足跡 44歲奪冠緊追穆帥

      我愛英超
      2026-05-20 05:55:30
      就她了!神舟二十三號(hào)三人組預(yù)測(cè),港產(chǎn)女載荷專家首秀將打破紀(jì)錄

      就她了!神舟二十三號(hào)三人組預(yù)測(cè),港產(chǎn)女載荷專家首秀將打破紀(jì)錄

      日不西沉
      2026-05-20 03:26:27
      《主角》黃正經(jīng)升局長(zhǎng),米蘭嫁人,才懂楚嘉禾示好易青娥多憋屈

      《主角》黃正經(jīng)升局長(zhǎng),米蘭嫁人,才懂楚嘉禾示好易青娥多憋屈

      八斗小先生
      2026-05-19 11:13:46
      母子同床15年?狄鶯終于將寶貝兒子送進(jìn)了監(jiān)獄!

      母子同床15年?狄鶯終于將寶貝兒子送進(jìn)了監(jiān)獄!

      新民周刊
      2026-05-18 14:05:28
      圓夢(mèng)時(shí)刻,漢密爾頓轉(zhuǎn)發(fā)球隊(duì)海報(bào)祝賀阿森納奪冠:COYG!

      圓夢(mèng)時(shí)刻,漢密爾頓轉(zhuǎn)發(fā)球隊(duì)海報(bào)祝賀阿森納奪冠:COYG!

      懂球帝
      2026-05-20 06:57:10
      1996年16歲的柳巖,在廣州一所中專學(xué)校就讀護(hù)理專業(yè)期間拍的照片

      1996年16歲的柳巖,在廣州一所中專學(xué)校就讀護(hù)理專業(yè)期間拍的照片

      戶外阿毽
      2026-05-19 13:00:42
      韓媒:朝鮮女足粗魯無禮!她們和中國(guó)隊(duì)擊掌問候,卻拒與日韓握手

      韓媒:朝鮮女足粗魯無禮!她們和中國(guó)隊(duì)擊掌問候,卻拒與日韓握手

      劉哥談體育
      2026-05-19 13:00:15
      烏克蘭打擊莫斯科,魏德爾嚇壞了,她怒斥烏克蘭襲擊俄羅斯本土!

      烏克蘭打擊莫斯科,魏德爾嚇壞了,她怒斥烏克蘭襲擊俄羅斯本土!

      開著車去流浪
      2026-05-20 00:40:17
      年僅54歲!武漢協(xié)和冷松因病醫(yī)治無效去世

      年僅54歲!武漢協(xié)和冷松因病醫(yī)治無效去世

      華醫(yī)網(wǎng)
      2026-05-19 15:21:37
      勇士隊(duì)傳聞:內(nèi)部人士承認(rèn)今夏補(bǔ)強(qiáng)陣容對(duì)抗雷霆和馬刺“不現(xiàn)實(shí)”

      勇士隊(duì)傳聞:內(nèi)部人士承認(rèn)今夏補(bǔ)強(qiáng)陣容對(duì)抗雷霆和馬刺“不現(xiàn)實(shí)”

      好火子
      2026-05-20 05:00:02
      西方媒體證實(shí):中國(guó)飛弩-16現(xiàn)身俄烏戰(zhàn)場(chǎng),攔截成功率70%

      西方媒體證實(shí):中國(guó)飛弩-16現(xiàn)身俄烏戰(zhàn)場(chǎng),攔截成功率70%

      流年顛簸
      2026-05-20 02:55:43
      丑人多作怪?被“網(wǎng)暴”多年后傅首爾終于急了,怪不得網(wǎng)友嘴太毒

      丑人多作怪?被“網(wǎng)暴”多年后傅首爾終于急了,怪不得網(wǎng)友嘴太毒

      琴琴有氧運(yùn)動(dòng)
      2026-05-19 04:47:56
      2026-05-20 07:40:49
      AI前線 incentive-icons
      AI前線
      面向AI愛好者、開發(fā)者和科學(xué)家,提供AI領(lǐng)域技術(shù)資訊。
      1509文章數(shù) 149關(guān)注度
      往期回顧 全部

      科技要聞

      馬斯克敗訴,法院判他起訴OpenAI太晚了

      頭條要聞

      伊朗最新和平方案披露 濃縮鈾只能運(yùn)往俄羅斯

      頭條要聞

      伊朗最新和平方案披露 濃縮鈾只能運(yùn)往俄羅斯

      體育要聞

      文班亞馬:沒拿到MVP,就證明自己是MVP

      娛樂要聞

      姚晨刪博難平眾怒,為什么她還能蹦噠

      財(cái)經(jīng)要聞

      白酒榜|汾酒營(yíng)收凈利雙增 口子窖"造富"

      汽車要聞

      煥新極氪009上市41.38萬起 齊家版讓MPV回歸家庭

      態(tài)度原創(chuàng)

      游戲
      家居
      藝術(shù)
      本地
      公開課

      難道反轉(zhuǎn)了?《GTA6》已在游戲電商平臺(tái)開放預(yù)售!

      家居要聞

      觀山隱秀 心靈沉淀

      藝術(shù)要聞

      李克農(nóng)將軍書法,字字皆是大將風(fēng)范!

      本地新聞

      別搜晉江小說了,去看真的晉江

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 无码专区av| 奇米777四色成人影视| 制服丝袜亚洲在线| 欧美日韩一卡2卡三卡4卡 乱码欧美孕交 | 国产三级精品三级在线专1| 在线看国产精品自拍内射 | 色福利网| 免费大黄网站在线观| 亚洲人妻精品中文字幕| 综合av一区| 成年无码av片在线| 国产精品色婷婷在线观看| 久久综合久久美利坚合众国| 蜜臀av无码一区二区三区| 国产免费丝袜调教视频| 人妻AV中文字幕一区二区三区| 精品国产国产2021| 色吊丝免费av一区二区| 亚洲欲妇| 无码国内精品久久人妻中文成人| 久久精品国产精品亚洲| 国产黄色自拍视频| 欧美偷窥清纯综合图区| 国产精品视频白浆免费视频| 欧美精品一区二区三区使用方法| 国产成人精品微拍视频网址| chinese性内射高清国产| 五月天激情小说| 成人妇女免费播放久久久| 久久中文字幕av不卡一区二区| 无遮挡一级毛片视频| 99热久久这里只有精品| 久久77| 台湾东方伊甸园av| 手机看片日韩国产毛片| 少妇高潮太爽了在线视频| 日韩va中文字幕无码电影| 九九天堂网| 国产乱子伦精品免费女| 国产成人小视频| 国产精品亚洲一区二区z|