小米不想“賤賣”token

2026-04-12 10:10:21　來源: 人人都是產(chǎn)品經(jīng)理社區(qū)

廣東舉報

分享至

小米MiMo大模型推出最高659元/月的訂閱套餐，直接對標Anthropic Claude，并宣布日調(diào)用量破萬億。不同于行業(yè)通用的“無限制訂閱”，MiMo采用“Token配額制”以解決Agent濫用導(dǎo)致的成本倒掛，明確拒絕“賤賣Token”。這標志著小米正試圖打破手機廠商僅將AI作為生態(tài)附庸的慣例，走上一條更為激進的獨立基座模型運營之路。

———— / BEGIN / ————

最近，小米宣布MiMo大模型面向全球開發(fā)者推出Token Plan訂閱套餐，雷軍親自發(fā)微博官宣：Max檔659元/月，面向國際開發(fā)者定價100美元/月，與Anthropic Claude Max 5x相同。同一天，雷軍發(fā)文稱MiMo大模型前一日調(diào)用量突破1萬億Token。

作為一家從手機做到汽車，制造業(yè)基因極強的公司，如今把大模型訂閱套餐價格直接錨定全球AI第一梯隊，這在行業(yè)里還是唯一一家，也引起了不少的爭議。仔細看，Mimo Token Plan的訂閱制，和大模型行業(yè)慣用的訂閱制還有一些根本上的不同。

羅福莉的發(fā)聲，不踩Anthropic踩過的坑？

MiMo Token Plan發(fā)布三天后，Anthropic宣布禁止Claude Pro和Max訂閱用戶通過OpenClaw等第三方Agent框架調(diào)用。

MiMo大模型負責人羅福莉隨即在社交平臺發(fā)布長文，詳細分析了這件事。

她首先解釋了Anthropic的困境。Claude的訂閱制（Pro 20美元/月，Max 100-200美元/月）原本是為個人用戶的正常使用強度設(shè)計的，但OpenClaw等Agent框架的調(diào)用模式完全不同：在單個用戶查詢中，框架會以獨立API請求的形式發(fā)出多輪低價值的工具調(diào)用，每個請求都包含超過10萬Token的上下文窗口，即使命中緩存，這也是一種浪費，在極端情況下還會拉低其他查詢的緩存命中率。

她表示：“實際每次查詢的請求數(shù)比Claude Code自身的框架高出數(shù)倍。換算成API定價，實際成本可能是訂閱價格的幾十倍。這可不是小差距，而是天壤之別。”

換句話說，Claude訂閱制的本質(zhì)問題是：固定月費無法覆蓋Agent場景下的實際算力消耗。用戶付200美元，卻用掉了幾千美元的計算資源。

羅福莉由此引出MiMo Token Plan的設(shè)計邏輯。她說，Token Plan支持第三方框架接入，但按Token配額計費，“與Claude新推出的額外使用套餐的邏輯相同”。這意味著用戶用多少付多少，不會出現(xiàn)訂閱制下“薅羊毛式”的成本倒掛。“我們的目標是長期穩(wěn)定地交付高質(zhì)量的模型和服務(wù)，而不是讓你沖動付費后就棄用。”

她也扮演了一次行業(yè)定價的“吹哨人”角色：“我建議LLM公司在弄清楚如何在不造成資金流失的情況下為Coding方案定價之前，不要盲目地競相壓低價格。以極低的價格出售Token，同時對第三方敞開大門，這看起來對用戶很有吸引力，但這卻是一個陷阱——Anthropic剛剛擺脫的那個陷阱。”

這篇帖子瀏覽量超過71萬，引發(fā)了大量討論。有開發(fā)者認同她對OpenClaw上下文管理低效的判斷，有人指出Anthropic此舉本質(zhì)上是在保護自家Claude Code的護城河，也有人對MiMo Token Plan本身的Credit換算機制提出質(zhì)疑。

現(xiàn)實的挑戰(zhàn)

100美元的定價有一定的合理性。MiMo-V2-Pro的API價格（輸入1美元/百萬Token，輸出3美元）約為Claude同級模型的五分之一，在性價比上確實有競爭力。兩周免費推廣期間，MiMo-V2-Pro在OpenRouter上單周Token消耗量突破4萬億，日榜、周榜、月榜均排名第一，編程領(lǐng)域市占率一度超過30%。

但挑戰(zhàn)來得很快。

免費期結(jié)束后，MiMo-V2-Pro在OpenRouter上的周調(diào)用量從高峰下滑。OpenRouter上的規(guī)律比較直接，在達到一定性能閾值后，誰便宜或免費，誰就有可能沖到榜一。它的排名證明了模型能力和可用性，但是同時，調(diào)用量受是否免費的影響巨大。

MiMo Token Plan四檔方案從39元/月到659元/月，Max檔國際定價100美元/月。按Credit換算，MiMo-V2-Pro消耗1 Token等于2 Credits，Max檔1600M Credits約等于800M Token的Pro模型調(diào)用量。

這個價格對標的是Anthropic Claude Max 5x套餐（100美元/月），后者提供Pro版5倍的使用額度。MiMo Token Plan沒有行業(yè)普遍存在的5小時使用限額，支持集中消耗Token。

開發(fā)者社區(qū)的爭議也不少。有用戶在社交網(wǎng)絡(luò)上拆解了小米Token Plan的實際消耗：由于Credit倍率機制（Pro模型1 Token消耗2 Credits，超過256K上下文則消耗4 Credits），加上Agent框架大量使用緩存Token，入門套餐的實際可用量遠低于字面數(shù)字。

也有開發(fā)者反饋MiMo-V2-Pro在復(fù)雜推理上偶爾出現(xiàn)“無限循環(huán)”，以及內(nèi)容審核系統(tǒng)誤攔截正常API調(diào)用的問題。

騰訊科技向小米官方求證， Credits到底如何折算為不同模型、不同上下文長度下的真實 token使用量，是否有完整公開的計算邏輯？但截至發(fā)稿，未得到官方的回應(yīng)。

但是從羅福莉的公開發(fā)聲來看，對“大模型訂閱制”算不清賬的問題已經(jīng)提出了質(zhì)疑，不“賤賣Token”，希望用健康的現(xiàn)金流來換取模型能力的穩(wěn)定迭代、用戶的持續(xù)使用，是基本態(tài)度。

圖：免費期結(jié)束后，MiMo-V2-Pro在OpenRouter上的周調(diào)用量從高峰下滑

理想很豐滿。但是，從免費到付費的轉(zhuǎn)換率，是所有大模型公司面臨的共同難題。從免費到付費切換的過程，也往往會面臨最大的爭議，MiMo能否在付費的前提下保持用戶黏性，是接下來幾周最值得觀察的數(shù)據(jù)點。

唯一還在做基座大模型的手機廠商？

在小米高調(diào)推自己的大模型的同時，也引出了一個疑問，大模型業(yè)務(wù)之于小米，到底意味著什么？

回到更早的時間線。2023年，雷軍推動成立大模型Core團隊。同年5月，根據(jù)媒體的公開報道，小米曾公開表示“小米不會做ChatGPT，不搞AI的軍備競賽”。

但小米的態(tài)度在悄悄發(fā)生轉(zhuǎn)變。

2025年4月，MiMo-7B開源；11月，前DeepSeek研究員羅福莉加入，出任大模型負責人；12月發(fā)布MiMo-V2-Flash。2026年3月19日凌晨，三款模型同步發(fā)布：萬億參數(shù)的MiMo-V2-Pro、全模態(tài)的Omni和語音合成TTS。發(fā)布前，Pro的早期版本以“Hunter Alpha”代號匿名上線OpenRouter，七天突破1萬億Token調(diào)用量，一度被社區(qū)猜測為“DeepSeek V4”。不到一年，小米的大模型從7B參數(shù)走到了萬億參數(shù)。

據(jù)接近小米的人士透露，小米內(nèi)部開始認為“大模型是未來科技公司必須要有的能力。小米未來所有產(chǎn)品端的能力，需要有一個主模型去控制、去培養(yǎng)、去指導(dǎo)。這個主模型必須是自己的。因為只有自己擁有，才能決定你的用戶習(xí)慣、你的輸入數(shù)據(jù)不交給第三方。”

手機、汽車、IoT設(shè)備產(chǎn)生的海量用戶數(shù)據(jù)是最核心的資產(chǎn)，如果基座模型依賴第三方，數(shù)據(jù)主權(quán)和產(chǎn)品迭代節(jié)奏都將受制于人。

從組織架構(gòu)看，大模型Core團隊歸屬小米集團技術(shù)委員會，不隸屬于手機部或汽車部。據(jù)了解，小米副總裁曲恒負責管理這條線，但羅福莉擁有很高的獨立性，她加入后按照自己的想法組建了團隊，核心成員平均年齡25歲，清北畢業(yè)生占比超六成。團隊運作有較高的自主性。

從財報及管理層對外發(fā)聲也可以看出，研發(fā)投入規(guī)模也在快速攀升。小米2025年全年研發(fā)開支331億元，同比增長37.8%，接近全年經(jīng)調(diào)整凈利潤392億元。據(jù)小米總裁盧偉冰在業(yè)績會上的表述，AI投入約占研發(fā)總額的四分之一。

雷軍在MiMo-V2-Pro發(fā)布當天宣布，2026年小米在AI領(lǐng)域的研發(fā)和資本投入將超過160億元，未來三年至少600億元。資本開支方面，2025年前三季度累計約130億元，同比增長86.7%，盧偉冰明確表示增量主要來自汽車和AI。算力上，小米采取自建萬卡GPU集群加金山云合作的混合模式。

從行業(yè)橫向?qū)Ρ葋砜矗∶椎倪x擇是孤獨的。華為盤古大模型主要通過鴻蒙系統(tǒng)實現(xiàn)端云協(xié)同，vivo藍心大模型服務(wù)于OriginOS的AI助手，OPPO安第斯大模型升級了小布助手，榮耀走AI終端生態(tài)路線。這些廠商的大模型都是“AI服務(wù)于手機”，沒有一家獨立運營API平臺或?qū)ν馐圪u模型訂閱。包括蘋果、三星在內(nèi)的全球手機巨頭，也沒有對外直接提供服務(wù)的基座大模型。

vivo副總裁周圍的公開表態(tài)也許可以代表了多數(shù)廠商的態(tài)度：未來手機可能進化為“智能體”，但實現(xiàn)路徑不一定需要自研基座模型，接入第三方大模型同樣可以。

大模型成為又一個主線業(yè)務(wù)？

從種種公開信息來看，大模型之于小米集團，正在發(fā)生一些微妙但關(guān)鍵的變化：它不只是一個服務(wù)于手機和IoT的底層能力，開始具備向一條獨立業(yè)務(wù)線演進的結(jié)構(gòu)性條件。最直觀的信號，是產(chǎn)品形態(tài)的變化。

小米已經(jīng)推出了面向開發(fā)者的API平臺，并配套提供分層的Token訂閱方案。無論規(guī)模大小，這一步本身，就已經(jīng)越過了傳統(tǒng)“技術(shù)中臺”的邊界。

雷軍曾在公開場合明確提出，小米計劃在2026年實現(xiàn)一次關(guān)鍵性的技術(shù)整合：在一款終端產(chǎn)品中，讓自研芯片、操作系統(tǒng)與AI大模型完成協(xié)同落地。

至今為止，能同時覆蓋這三層能力的公司并不多。華為通過麒麟芯片、鴻蒙系統(tǒng)與盤古模型，已經(jīng)形成過相對完整的技術(shù)閉環(huán)；蘋果公司則長期在芯片與操作系統(tǒng)上建立深度一體化，并正在強化其端側(cè)AI能力。

小米如果完成這一組合，也許能進入一個截然不同的競爭維度。

但如果把視角拉回財報，情況又顯得克制得多。

根據(jù)披露，小米將AI相關(guān)業(yè)務(wù)與智能電動汽車一同歸入“創(chuàng)新業(yè)務(wù)”板塊。2025年，該板塊收入為1061億元，其中汽車貢獻了約1033億元，AI相關(guān)收入尚未被單獨披露。產(chǎn)品和形態(tài)已經(jīng)在向獨立業(yè)務(wù)靠攏，但公開財務(wù)信息上還未完成驗證。

當小米將高階訂閱方案定在與Claude相近的區(qū)間，并開始質(zhì)疑行業(yè)普遍推行的訂閱制的時候，目的可能未必在于“價格競爭”。通過錨定頭部模型，主動進入同一層級的市場敘事，證明“上桌的能力”可能更為重要。

本文來自公眾號：騰訊科技作者：曉靜編輯：徐青陽

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.