Agent 時(shí)代,我們需要正確的計(jì)費(fèi)和工程設(shè)計(jì)哲學(xué),這是 Xiaomi MiMo 大模型負(fù)責(zé)人羅福莉剛剛在 X 上發(fā)表的觀點(diǎn)。
![]()
前兩天,我們報(bào)道了——Anthropic 宣布,即日起,Claude Pro 和 Max 訂閱用戶(hù),不得再將訂閱額度用于 OpenClaw 等第三方 Agent 框架。想繼續(xù)用?那就必須切換到按用量付費(fèi)的 API。這讓很多用訂閱模式玩「龍蝦」的 Claude 用戶(hù)瞬間懵了。
Anthropic 官方解釋稱(chēng),訂閱制的定價(jià)模型原本是基于「?jìng)€(gè)人用戶(hù)正常使用強(qiáng)度」設(shè)計(jì)的,但 OpenClaw 這類(lèi)自動(dòng)化代理工具的使用強(qiáng)度遠(yuǎn)超預(yù)期 —— 有重度用戶(hù)每月僅支付 200 刀訂閱費(fèi),卻消耗了價(jià)值 5000 刀的算力資源,給 Anthropic 帶來(lái)巨大成本壓力。
消息一出,各方反應(yīng)不一,有人大呼「被背刺」,覺(jué)得訂閱模式瞬間失去了吸引力;也有人拍手叫好,認(rèn)為這是在清理低效使用,保護(hù)整個(gè)平臺(tái)的可持續(xù)性。
無(wú)論哪種聲音,核心問(wèn)題都暴露了出來(lái):現(xiàn)在的 token 計(jì)費(fèi)模式已經(jīng)很難應(yīng)對(duì)挑戰(zhàn),我們需要更聰明、更可持續(xù)的算力使用方式。
在帖子中,羅福莉首先指出,Anthropic 的訂閱制本來(lái)就是虧本在跑。
Claude Code 的訂閱制是一套設(shè)計(jì)精良的算力均衡分配系統(tǒng)。我的判斷是 —— 它大概率不賺錢(qián),甚至可能在虧錢(qián),除非他們的 API 利潤(rùn)率有 10-20 倍,但我對(duì)此存疑。第三方框架接入造成多大虧損,我沒(méi)法精確計(jì)算,但我近距離看過(guò) OpenClaw 的 context 管理 —— 寫(xiě)得很差。一個(gè)用戶(hù)請(qǐng)求之內(nèi),它會(huì)觸發(fā)多輪低價(jià)值的工具調(diào)用,每次都作為獨(dú)立 API 請(qǐng)求發(fā)出,每次都攜帶一個(gè)很長(zhǎng)的上下文窗口(往往超過(guò) 10 萬(wàn) token)—— 即便緩存命中,也極度浪費(fèi),極端情況下還會(huì)拉高其他請(qǐng)求的緩存未命中率。
折算下來(lái),每個(gè)用戶(hù)請(qǐng)求實(shí)際觸發(fā)的 API 調(diào)用次數(shù),是 Claude Code 自身框架的好幾倍。換算成 API 定價(jià),真實(shí)成本大概是訂閱價(jià)格的幾十倍。這不是差距 —— 這是一個(gè)坑。
對(duì)于此次訂閱用戶(hù)被切斷的陣痛,她認(rèn)為,這次陣痛長(zhǎng)期來(lái)看是有好處的,會(huì)倒逼工程進(jìn)步。
OpenClaw、OpenCode 這類(lèi)第三方框架仍然可以通過(guò) API 調(diào)用 Claude,只是不能再搭訂閱的便車(chē)了。短期內(nèi),這些 Agent 用戶(hù)會(huì)很痛 —— 成本輕松跳漲幾十倍。但這種壓力,恰恰是推動(dòng)這些框架認(rèn)真改進(jìn) context 管理、最大化 prompt 緩存命中率以復(fù)用已處理的上下文、削減無(wú)效 token 消耗的動(dòng)力。痛苦終將轉(zhuǎn)化為工程紀(jì)律。
同時(shí),她發(fā)出警告,勸大模型公司別盲目?jī)r(jià)格戰(zhàn),低價(jià)賣(mài) Token 卻放任第三方工具薅羊毛是陷阱。
我想勸大模型廠(chǎng)商們,在沒(méi)想清楚如何給 coding 訂閱定價(jià)、不至于大出血之前,不要盲目卷到價(jià)格底部。把 token 賣(mài)得極便宜、同時(shí)對(duì)第三方框架敞開(kāi)大門(mén),表面上對(duì)用戶(hù)友好,實(shí)則是個(gè)陷阱 ——Anthropic 剛剛從這個(gè)陷阱里爬出來(lái)。更深的問(wèn)題在于:如果用戶(hù)把時(shí)間和精力耗在質(zhì)量低劣的 Agent 框架上、耗在極不穩(wěn)定又慢的推理服務(wù)上、耗在為降本而縮水的模型上,最后發(fā)現(xiàn)還是什么事都做不成 —— 這對(duì)用戶(hù)體驗(yàn)和留存都是惡性循環(huán)。
接下來(lái),她還介紹了小米最近推出的 MiMo Token Plan,并強(qiáng)調(diào)她們「追求的是長(zhǎng)期穩(wěn)定地交付高質(zhì)量的模型和服務(wù)」。
關(guān)于 MiMo Token Plan—— 它支持第三方框架接入,按 token 配額計(jì)費(fèi),邏輯和 Claude 新推出的 extra usage 包一致。因?yàn)槲覀冏非蟮氖情L(zhǎng)期穩(wěn)定地交付高質(zhì)量的模型和服務(wù) —— 不是讓你沖動(dòng)付款,然后棄船而去。
![]()
![]()
她最后指出,當(dāng)前全球算力供給已經(jīng)跟不上 Agent 創(chuàng)造的 token 需求。真正的出路不是更便宜的 token,而是協(xié)同進(jìn)化 ——「更省 token 的 Agent 框架」 × 「更強(qiáng)大、更高效的模型」。Anthropic 這次的行動(dòng),不管他們是否有意為之,都在把整個(gè)生態(tài)系統(tǒng) —— 開(kāi)源和閉源 —— 往這個(gè)方向推。這大概是件好事。
對(duì)于羅福莉的觀點(diǎn),開(kāi)發(fā)者社區(qū)反應(yīng)強(qiáng)烈,并且討論的焦點(diǎn)迅速?gòu)摹窤nthropic 對(duì)不對(duì)」升級(jí)到了幾個(gè)更根本的問(wèn)題:
1、這不是一場(chǎng)定價(jià)爭(zhēng)議,而是 AI 經(jīng)濟(jì)學(xué)的結(jié)構(gòu)性重寫(xiě)。
就像羅福莉所說(shuō),AI 服務(wù)的單位成本,從來(lái)就不是由模型單獨(dú)決定的,而是由「模型 × 框架 × context 管理」三者疊加決定。Anthropic 這次行動(dòng),無(wú)意中對(duì) Agent 框架制造了一次自然選擇壓力。
![]()
更有人直接說(shuō):Anthropic 此舉真正傳遞的信號(hào)是 —— 編排層才是產(chǎn)品,而不僅僅是模型本身。訂閱制與 API 計(jì)費(fèi)之間的張力,不過(guò)是這個(gè)更深層邏輯的表面癥狀。
![]()
2、別急著罵定價(jià),先看看算力是怎么被燒掉的。
羅福莉說(shuō)的「算力浪費(fèi)」,在從業(yè)者那里得到了強(qiáng)烈共鳴。有人一針見(jiàn)血:這根本不是「AI 太貴」的問(wèn)題,而是「算力被糟蹋」的問(wèn)題 —— 粗糙的框架設(shè)計(jì)加上龐大的上下文窗口加上不必要的冗余調(diào)用,燒掉的錢(qián)換不來(lái)任何真實(shí)產(chǎn)出。
![]()
更深的洞察來(lái)自一位開(kāi)發(fā)者,他指出:Claude Code 里對(duì) context 的處理決策,從來(lái)不是什么默認(rèn)參數(shù),而是對(duì)「保留什么、丟棄什么、何時(shí)壓縮」反復(fù)推敲后烘焙進(jìn)架構(gòu)里的判斷力。第三方框架缺的不是功能,是這種內(nèi)置的工程意見(jiàn)。
![]()
另一位開(kāi)發(fā)者則用自身經(jīng)歷印證了這一點(diǎn):他上個(gè)月花了大量時(shí)間清理為客戶(hù)搭建的舊編排層里的冗余邏輯,「清理爛攤子,比當(dāng)初搭的時(shí)候費(fèi)力多了」。
![]()
3、市場(chǎng)淘汰已經(jīng)開(kāi)始,但結(jié)局未定。
羅福莉認(rèn)為成本壓力會(huì)倒逼框架進(jìn)化,但開(kāi)發(fā)者們提出了一個(gè)更殘酷的問(wèn)題:第三方框架能不能足夠快地把效率差距補(bǔ)上,讓 API 定價(jià)在經(jīng)濟(jì)上仍然說(shuō)得過(guò)去?還是大多數(shù)用戶(hù)發(fā)現(xiàn)成本太慘烈,直接默認(rèn)回到 Claude Code?
![]()
這兩條路通向截然不同的生態(tài)格局。有開(kāi)發(fā)者補(bǔ)充說(shuō):框架開(kāi)發(fā)者真正需要的,不是「包含在內(nèi)」的接入權(quán),而是清晰可預(yù)期的 token 配額限制 —— 明確的邊界反而會(huì)催生更好的產(chǎn)品行為,模糊的灰色地帶只會(huì)制造混亂。
![]()
羅福莉這個(gè)帖子是一個(gè)非常具有前瞻性的技術(shù)演進(jìn)信號(hào),相關(guān)討論也切中了當(dāng)前 AI 軟件工程的核心痛點(diǎn)。接下來(lái),就看整個(gè)市場(chǎng)如何從「粗放燃燒算力」轉(zhuǎn)向「精細(xì)化工程架構(gòu)」了。
文章來(lái)源:機(jī)器之心。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.