小米MiMo大模型推出最高659元/月的訂閱套餐,直接對標Anthropic Claude,并宣布日調(diào)用量破萬億。不同于行業(yè)通用的“無限制訂閱”,MiMo采用“Token配額制”以解決Agent濫用導(dǎo)致的成本倒掛,明確拒絕“賤賣Token”。這標志著小米正試圖打破手機廠商僅將AI作為生態(tài)附庸的慣例,走上一條更為激進的獨立基座模型運營之路。
———— / BEGIN / ————
最近,小米宣布MiMo大模型面向全球開發(fā)者推出Token Plan訂閱套餐,雷軍親自發(fā)微博官宣:Max檔659元/月,面向國際開發(fā)者定價100美元/月,與Anthropic Claude Max 5x相同。同一天,雷軍發(fā)文稱MiMo大模型前一日調(diào)用量突破1萬億Token。
作為一家從手機做到汽車,制造業(yè)基因極強的公司,如今把大模型訂閱套餐價格直接錨定全球AI第一梯隊,這在行業(yè)里還是唯一一家,也引起了不少的爭議。仔細看,Mimo Token Plan的訂閱制,和大模型行業(yè)慣用的訂閱制還有一些根本上的不同。
羅福莉的發(fā)聲,不踩Anthropic踩過的坑?
MiMo Token Plan發(fā)布三天后,Anthropic宣布禁止Claude Pro和Max訂閱用戶通過OpenClaw等第三方Agent框架調(diào)用。
MiMo大模型負責人羅福莉隨即在社交平臺發(fā)布長文,詳細分析了這件事。
她首先解釋了Anthropic的困境。Claude的訂閱制(Pro 20美元/月,Max 100-200美元/月)原本是為個人用戶的正常使用強度設(shè)計的,但OpenClaw等Agent框架的調(diào)用模式完全不同:在單個用戶查詢中,框架會以獨立API請求的形式發(fā)出多輪低價值的工具調(diào)用,每個請求都包含超過10萬Token的上下文窗口,即使命中緩存,這也是一種浪費,在極端情況下還會拉低其他查詢的緩存命中率。
她表示:“實際每次查詢的請求數(shù)比Claude Code自身的框架高出數(shù)倍。換算成API定價,實際成本可能是訂閱價格的幾十倍。這可不是小差距,而是天壤之別。”
換句話說,Claude訂閱制的本質(zhì)問題是:固定月費無法覆蓋Agent場景下的實際算力消耗。用戶付200美元,卻用掉了幾千美元的計算資源。
羅福莉由此引出MiMo Token Plan的設(shè)計邏輯。她說,Token Plan支持第三方框架接入,但按Token配額計費,“與Claude新推出的額外使用套餐的邏輯相同”。這意味著用戶用多少付多少,不會出現(xiàn)訂閱制下“薅羊毛式”的成本倒掛。“我們的目標是長期穩(wěn)定地交付高質(zhì)量的模型和服務(wù),而不是讓你沖動付費后就棄用。”
她也扮演了一次行業(yè)定價的“吹哨人”角色:“我建議LLM公司在弄清楚如何在不造成資金流失的情況下為Coding方案定價之前,不要盲目地競相壓低價格。以極低的價格出售Token,同時對第三方敞開大門,這看起來對用戶很有吸引力,但這卻是一個陷阱——Anthropic剛剛擺脫的那個陷阱。”
這篇帖子瀏覽量超過71萬,引發(fā)了大量討論。有開發(fā)者認同她對OpenClaw上下文管理低效的判斷,有人指出Anthropic此舉本質(zhì)上是在保護自家Claude Code的護城河,也有人對MiMo Token Plan本身的Credit換算機制提出質(zhì)疑。
![]()
現(xiàn)實的挑戰(zhàn)
100美元的定價有一定的合理性。MiMo-V2-Pro的API價格(輸入1美元/百萬Token,輸出3美元)約為Claude同級模型的五分之一,在性價比上確實有競爭力。兩周免費推廣期間,MiMo-V2-Pro在OpenRouter上單周Token消耗量突破4萬億,日榜、周榜、月榜均排名第一,編程領(lǐng)域市占率一度超過30%。
但挑戰(zhàn)來得很快。
免費期結(jié)束后,MiMo-V2-Pro在OpenRouter上的周調(diào)用量從高峰下滑。OpenRouter上的規(guī)律比較直接,在達到一定性能閾值后,誰便宜或免費,誰就有可能沖到榜一。它的排名證明了模型能力和可用性,但是同時,調(diào)用量受是否免費的影響巨大。
MiMo Token Plan四檔方案從39元/月到659元/月,Max檔國際定價100美元/月。按Credit換算,MiMo-V2-Pro消耗1 Token等于2 Credits,Max檔1600M Credits約等于800M Token的Pro模型調(diào)用量。
這個價格對標的是Anthropic Claude Max 5x套餐(100美元/月),后者提供Pro版5倍的使用額度。MiMo Token Plan沒有行業(yè)普遍存在的5小時使用限額,支持集中消耗Token。
開發(fā)者社區(qū)的爭議也不少。有用戶在社交網(wǎng)絡(luò)上拆解了小米Token Plan的實際消耗:由于Credit倍率機制(Pro模型1 Token消耗2 Credits,超過256K上下文則消耗4 Credits),加上Agent框架大量使用緩存Token,入門套餐的實際可用量遠低于字面數(shù)字。
也有開發(fā)者反饋MiMo-V2-Pro在復(fù)雜推理上偶爾出現(xiàn)“無限循環(huán)”,以及內(nèi)容審核系統(tǒng)誤攔截正常API調(diào)用的問題。
騰訊科技向小米官方求證, Credits到底如何折算為不同模型、不同上下文長度下的真實 token使用量,是否有完整公開的計算邏輯?但截至發(fā)稿,未得到官方的回應(yīng)。
但是從羅福莉的公開發(fā)聲來看,對“大模型訂閱制”算不清賬的問題已經(jīng)提出了質(zhì)疑,不“賤賣Token”,希望用健康的現(xiàn)金流來換取模型能力的穩(wěn)定迭代、用戶的持續(xù)使用,是基本態(tài)度。
![]()
圖:免費期結(jié)束后,MiMo-V2-Pro在OpenRouter上的周調(diào)用量從高峰下滑
理想很豐滿。但是,從免費到付費的轉(zhuǎn)換率,是所有大模型公司面臨的共同難題。從免費到付費切換的過程,也往往會面臨最大的爭議,MiMo能否在付費的前提下保持用戶黏性,是接下來幾周最值得觀察的數(shù)據(jù)點。
唯一還在做基座大模型的手機廠商?
在小米高調(diào)推自己的大模型的同時,也引出了一個疑問,大模型業(yè)務(wù)之于小米,到底意味著什么?
回到更早的時間線。2023年,雷軍推動成立大模型Core團隊。同年5月,根據(jù)媒體的公開報道,小米曾公開表示“小米不會做ChatGPT,不搞AI的軍備競賽”。
但小米的態(tài)度在悄悄發(fā)生轉(zhuǎn)變。
2025年4月,MiMo-7B開源;11月,前DeepSeek研究員羅福莉加入,出任大模型負責人;12月發(fā)布MiMo-V2-Flash。2026年3月19日凌晨,三款模型同步發(fā)布:萬億參數(shù)的MiMo-V2-Pro、全模態(tài)的Omni和語音合成TTS。發(fā)布前,Pro的早期版本以“Hunter Alpha”代號匿名上線OpenRouter,七天突破1萬億Token調(diào)用量,一度被社區(qū)猜測為“DeepSeek V4”。不到一年,小米的大模型從7B參數(shù)走到了萬億參數(shù)。
據(jù)接近小米的人士透露,小米內(nèi)部開始認為“大模型是未來科技公司必須要有的能力。小米未來所有產(chǎn)品端的能力,需要有一個主模型去控制、去培養(yǎng)、去指導(dǎo)。這個主模型必須是自己的。因為只有自己擁有,才能決定你的用戶習(xí)慣、你的輸入數(shù)據(jù)不交給第三方。”
手機、汽車、IoT設(shè)備產(chǎn)生的海量用戶數(shù)據(jù)是最核心的資產(chǎn),如果基座模型依賴第三方,數(shù)據(jù)主權(quán)和產(chǎn)品迭代節(jié)奏都將受制于人。
從組織架構(gòu)看,大模型Core團隊歸屬小米集團技術(shù)委員會,不隸屬于手機部或汽車部。據(jù)了解,小米副總裁曲恒負責管理這條線,但羅福莉擁有很高的獨立性,她加入后按照自己的想法組建了團隊,核心成員平均年齡25歲,清北畢業(yè)生占比超六成。團隊運作有較高的自主性。
從財報及管理層對外發(fā)聲也可以看出,研發(fā)投入規(guī)模也在快速攀升。小米2025年全年研發(fā)開支331億元,同比增長37.8%,接近全年經(jīng)調(diào)整凈利潤392億元。據(jù)小米總裁盧偉冰在業(yè)績會上的表述,AI投入約占研發(fā)總額的四分之一。
雷軍在MiMo-V2-Pro發(fā)布當天宣布,2026年小米在AI領(lǐng)域的研發(fā)和資本投入將超過160億元,未來三年至少600億元。資本開支方面,2025年前三季度累計約130億元,同比增長86.7%,盧偉冰明確表示增量主要來自汽車和AI。算力上,小米采取自建萬卡GPU集群加金山云合作的混合模式。
從行業(yè)橫向?qū)Ρ葋砜矗∶椎倪x擇是孤獨的。華為盤古大模型主要通過鴻蒙系統(tǒng)實現(xiàn)端云協(xié)同,vivo藍心大模型服務(wù)于OriginOS的AI助手,OPPO安第斯大模型升級了小布助手,榮耀走AI終端生態(tài)路線。這些廠商的大模型都是“AI服務(wù)于手機”,沒有一家獨立運營API平臺或?qū)ν馐圪u模型訂閱。包括蘋果、三星在內(nèi)的全球手機巨頭,也沒有對外直接提供服務(wù)的基座大模型。
vivo副總裁周圍的公開表態(tài)也許可以代表了多數(shù)廠商的態(tài)度:未來手機可能進化為“智能體”,但實現(xiàn)路徑不一定需要自研基座模型,接入第三方大模型同樣可以。
大模型成為又一個主線業(yè)務(wù)?
從種種公開信息來看,大模型之于小米集團,正在發(fā)生一些微妙但關(guān)鍵的變化:它不只是一個服務(wù)于手機和IoT的底層能力,開始具備向一條獨立業(yè)務(wù)線演進的結(jié)構(gòu)性條件。最直觀的信號,是產(chǎn)品形態(tài)的變化。
小米已經(jīng)推出了面向開發(fā)者的API平臺,并配套提供分層的Token訂閱方案。無論規(guī)模大小,這一步本身,就已經(jīng)越過了傳統(tǒng)“技術(shù)中臺”的邊界。
雷軍曾在公開場合明確提出,小米計劃在2026年實現(xiàn)一次關(guān)鍵性的技術(shù)整合:在一款終端產(chǎn)品中,讓自研芯片、操作系統(tǒng)與AI大模型完成協(xié)同落地。
至今為止,能同時覆蓋這三層能力的公司并不多。華為通過麒麟芯片、鴻蒙系統(tǒng)與盤古模型,已經(jīng)形成過相對完整的技術(shù)閉環(huán);蘋果公司則長期在芯片與操作系統(tǒng)上建立深度一體化,并正在強化其端側(cè)AI能力。
小米如果完成這一組合,也許能進入一個截然不同的競爭維度。
但如果把視角拉回財報,情況又顯得克制得多。
根據(jù)披露,小米將AI相關(guān)業(yè)務(wù)與智能電動汽車一同歸入“創(chuàng)新業(yè)務(wù)”板塊。2025年,該板塊收入為1061億元,其中汽車貢獻了約1033億元,AI相關(guān)收入尚未被單獨披露。產(chǎn)品和形態(tài)已經(jīng)在向獨立業(yè)務(wù)靠攏,但公開財務(wù)信息上還未完成驗證。
當小米將高階訂閱方案定在與Claude相近的區(qū)間,并開始質(zhì)疑行業(yè)普遍推行的訂閱制的時候,目的可能未必在于“價格競爭”。通過錨定頭部模型,主動進入同一層級的市場敘事,證明“上桌的能力”可能更為重要。
本文來自公眾號:騰訊科技 作者:曉靜 編輯:徐青陽
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.