![]()
文:王智遠(yuǎn) | ID:Z201440
MiniMax M2.5 的新聞大家可能已經(jīng)刷到了。
開源、性能對齊 Claude Opus 4.6、SWE-Bench 80.2%、推理速度是Opus的3倍……
數(shù)據(jù)都很漂亮。但我注意到一個(gè)數(shù)字,它比所有跑分都更值得琢磨:1美金/小時(shí)
什么意思?
你花1美金,能讓一個(gè)SOTA級別的AI Agent連續(xù)工作一小時(shí),寫代碼、做Excel、查資料、寫PPT,24小時(shí)不眠不休。
歷史上,每一次技術(shù)革命的真正爆發(fā)點(diǎn),還有價(jià)格跌破心理閾值的那一刻;所以,我想聊一個(gè)議題:當(dāng)AI勞動(dòng)力的時(shí)薪降到1美金,世界會(huì)發(fā)生什么?
01
咱們先把這個(gè)數(shù)字放在真實(shí)世界。美國勞工統(tǒng)計(jì)局的數(shù)據(jù),知識工作者的中位時(shí)薪,大概是35到40美金。這是一個(gè)什么水平?
舊金山一個(gè)剛畢業(yè)的本科生,進(jìn)科技公司做運(yùn)營,時(shí)薪差不多就是這個(gè)數(shù);紐約一家咨詢公司的初級分析師,每小時(shí)也能拿到35美金左右。
國內(nèi)呢?
我查了一下招聘網(wǎng)站,互聯(lián)網(wǎng)行業(yè)的產(chǎn)品經(jīng)理、運(yùn)營、市場這些白領(lǐng),平均時(shí)薪在50到80人民幣之間,折合下來7到11美金。
哪怕是把人力外包到東南亞,菲律賓、越南的英語客服,時(shí)薪也很難低于3到5美金。
而M2.5給出的價(jià)格是:1美金/小時(shí)。這還沒完。MiniMax官方有一個(gè)補(bǔ)充說明:在每秒輸出50個(gè)token的模式下,這個(gè)數(shù)字還能進(jìn)一步降到0.3美金/小時(shí)。
0.3美金什么概念?在北京,一瓶礦泉水的價(jià)格。在上海,一趟地鐵的價(jià)格。在硅谷,連給小費(fèi)都不夠。
咱們再換一個(gè)角度算賬。
人類一天工作8小時(shí),一年工作250天,這是法定的上限;但AI可以7x24小時(shí)連軸轉(zhuǎn),一年365天不休。你睡覺時(shí),它在干活,你過春節(jié)它在干活,你休年假它還在干活。
所以,真實(shí)效率比是接近200:1。
一個(gè)AI Agent ,一年能產(chǎn)出的工時(shí),相當(dāng)于200個(gè)全職人類員工。當(dāng)然,這不是說一個(gè)AI能替代200個(gè)人,人能做很多AI做不了的事。
但這個(gè)數(shù)字告訴我們另一件事:過去因?yàn)槿肆Τ杀咎叨覆恢档米觥沟氖虑椋F(xiàn)在可能都值得做了。
舉個(gè)例子:
一家電商平臺(tái),有100萬活躍用戶。理論上,如果給每個(gè)用戶做一次生日關(guān)懷、一次個(gè)性化回訪,轉(zhuǎn)化率肯定能提升;但過去這事沒人干,為什么?
因?yàn)?00萬次個(gè)性化溝通,按人力成本算,得雇幾十個(gè)客服,一年幾百萬的支出,ROI算不過來。
現(xiàn)在呢?
一個(gè)AI Agent,1美金一小時(shí),一天干的活相當(dāng)于幾百個(gè)人類客服同時(shí)開工;100萬次個(gè)性化溝通,按人力算得幾十個(gè)人干一年,按AI算,可能幾千美金就搞定了。
所以你看,1美金/小時(shí)的意義,在于把過去「不值得」的事,變成了「值得」,把過去「只能想想」的事,變成了「可以試試」。
這就是我說的臨界點(diǎn)。當(dāng)成本低到一定程度,決策邏輯就變了。變成什么呢?你可以隨時(shí)隨地問問AI,而且不用擔(dān)心價(jià)格問題。
02
有人肯定會(huì)滿腦子疑惑:OpenAI、Anthropic都那么強(qiáng),這家公司把價(jià)格打到這個(gè)份上,靠補(bǔ)貼嗎?還是賠本賺吆喝?
都不是。
我看了下MiniMax發(fā)的一篇技術(shù)報(bào)告,里面有一個(gè)東西叫「Forge」的訓(xùn)練體系。什么是Forge系統(tǒng)?它是一個(gè)會(huì)「派活」的管家。
簡單講,它讓模型學(xué)會(huì)三件事:
一,讓快的不用等慢的。真實(shí)世界里,AI干活的速度不一樣。查天氣幾秒就完事,寫代碼可能要幾小時(shí)。如果死板地按順序處理,快的就得等慢的。
Forge怎么解決?
它做了一個(gè)叫「Windowed FIFO」的調(diào)度策略,角色很清晰,手里攥著一堆任務(wù),知道誰快誰慢,知道哪個(gè)該先派活、哪個(gè)可以等等。
比如:遇到查天氣這種快任務(wù),管家立刻派給一個(gè)輕量級的「技能模塊」去處理;遇到寫代碼這種慢任務(wù),管家把它交給專門的「代碼專家」,然后扭頭就去處理下一個(gè)快任務(wù),它們互不耽誤,異步協(xié)同。
結(jié)果是整體效率最大化,同樣一臺(tái)機(jī)器,能產(chǎn)出更多活,單位成本自然就降下來了。
第二件事,讓「反復(fù)算舊賬」這事不再發(fā)生。
Agent干貨有個(gè)特點(diǎn),它會(huì)反復(fù)調(diào)用模型,每次調(diào)用都帶著長長的歷史記錄。比如:你跟它聊了50句,第51句時(shí)它還得把前50句都「回憶」一遍。
傳統(tǒng)方法里,這相當(dāng)于每次都要從頭算一遍歷史,就像我們每天上班,都得重新讀一遍過去一周的聊天記錄才能開始干活,你說累不累?
Forge也很煩,它做了一個(gè)叫「前綴樹合并」的創(chuàng)新,所有共享歷史的請求,只算一次。
舉個(gè)例子:
你問AI「幫我寫一個(gè)電商網(wǎng)站」,接著又說再加個(gè)購物車功能,F(xiàn)orge則直接把新功能「嫁接」上去,只算新增的部分。
![]()
注釋:圖里上半部分是傳統(tǒng)做法:三個(gè)請求,每個(gè)都帶著長長的公共前綴,重復(fù)計(jì)算三次;下半部分是Forge的做法:把公共前綴合并成一棵樹,只算一次。40倍加速,就是這么省出來的。
官方數(shù)據(jù)是:40倍訓(xùn)練加速;同樣一筆算力預(yù)算,別人能訓(xùn)練1次,F(xiàn)orge能訓(xùn)練40次。經(jīng)驗(yàn)值的差距,就是這樣拉開的。
光拉開差距還不夠。Forge還在意一件事:過程。
過去訓(xùn)練AI,往只看最終結(jié)果,比如,代碼跑通了,好;沒跑通,不好。這叫稀疏獎(jiǎng)勵(lì);問題是,中間走了多少彎路、浪費(fèi)了多少時(shí)間,系統(tǒng)不管。
Forge引入了過程獎(jiǎng)勵(lì)。它除了看結(jié)果,還看中間步驟,類似有沒有亂用工具?是不是繞了遠(yuǎn)路?完成任務(wù)花了多長時(shí)間?這些都會(huì)被計(jì)入「獎(jiǎng)懲」。
于是,這讓模型學(xué)會(huì)了「又快又好」地干活;是真的在琢磨,怎么用最短的路徑把事辦成。
這直接解釋了為什么M2.5能做到推理速度是其他模型的兩倍,因?yàn)樗挥?xùn)練成了一個(gè)追求效率的「職場老手」,而非一個(gè)為了刷題不惜熬夜的「考試機(jī)器」。
所以,1美金/小時(shí)怎么來的?
靠一套系統(tǒng)工程,把訓(xùn)練和推理中的每一份算力都榨干,把每一處冗余都去掉,一點(diǎn)一點(diǎn)摳出來的。
我非常認(rèn)可一個(gè)觀點(diǎn),當(dāng)推理消耗變成生產(chǎn)資料,模型廠商就有機(jī)會(huì)把「算力稀缺」通過分層定價(jià)轉(zhuǎn)化為毛利,M2.5的1美金,是把算力從「資源」變成「生產(chǎn)資料」的開始。
換句話說,MiniMax在重構(gòu)成本結(jié)構(gòu);這兩件事,看著結(jié)果一樣,但指向完全不同的未來。
03
未來會(huì)怎么樣?1美金的AI,會(huì)怎么改變各行各業(yè)?
咱們把賬再往下算一層,先說結(jié)論,它意味著一個(gè)「永遠(yuǎn)在線、從不請假、時(shí)薪只要1美金」的員工,是可以直接放進(jìn)業(yè)務(wù)流程里的那種。
咱們試著拆一下成本怎么一層一層傳導(dǎo)下去的。
MiniMax M2.5算力中心那一層,MoE架構(gòu)、PD分離、全局KV緩存,這些技術(shù)名詞不展開,只說結(jié)果,單位算力的產(chǎn)出翻了一倍不止,原來跑一個(gè)模型需要兩臺(tái)機(jī)器,現(xiàn)在一臺(tái)就夠了。
再說模型廠商,F(xiàn)orge系統(tǒng)的40倍訓(xùn)練加速,把研發(fā)成本攤薄了,原來花1億美金訓(xùn)練出來的能力,現(xiàn)在花250萬就能搞定。
至于API,100 TPS吞吐量,意味著每一塊錢能買到更多的token。原來1塊錢買1000個(gè)token,現(xiàn)在能買3000個(gè)。
注意,100 TPS什么意思呢?
打個(gè)比方:可以把大模型想象成一家餐廳的后廚,TPS是「每秒能出多少道菜」;普通后廚一秒鐘出兩道菜,高峰期就堵死了;M2.5的后廚一秒鐘能出100道菜,哪怕客人排長隊(duì),它也能流水一樣往外端。
這個(gè)「出菜速度」落在企業(yè)端,就是另一回事了。
原來你做一個(gè)批量任務(wù),比如:生成1萬條商品描述,得等半天才能拿到結(jié)果。現(xiàn)在同樣的任務(wù),幾分鐘就干完了。這意味著你可以把離線跑批」變成「實(shí)時(shí)響應(yīng)」。
落到消費(fèi)者這邊,感受更直接。你跟AI聊天,它回一句要等兩三秒,你會(huì)覺得卡;如果它秒回,你就感覺順。這100 TPS,就是把卡變成順的那道坎。
所以,別小看這個(gè)數(shù)字,它是技術(shù)指標(biāo),更是用戶體驗(yàn)的分水嶺,也是單位成本能打下來的底氣所在。好,賬算清楚了。那這筆賬落在真實(shí)世界里,長什么樣?
我就隨便挑兩個(gè)場景:
一個(gè)是服務(wù)業(yè)。以前客服、售后、用戶運(yùn)營這些崗位,永遠(yuǎn)是抽樣服務(wù),100個(gè)用戶進(jìn)來,能覆蓋20個(gè)就算不錯(cuò)了,因?yàn)槿司湍敲炊啵瑫r(shí)間就那么多。
現(xiàn)在一個(gè)AI Agent可以7x24小時(shí)在線,每個(gè)用戶進(jìn)來都能被照顧到。不是「抽樣」,是「全覆蓋」。
你想想,年費(fèi)幾十萬的SaaS客戶,以前只能在工作時(shí)間找客服;現(xiàn)在半夜三點(diǎn)遇到問題,AI能秒回,這難道不是體驗(yàn)重構(gòu)嗎?
另一個(gè),中小企業(yè)。
小公司請不起法務(wù)、請不起財(cái)務(wù)、請不起市場總監(jiān),因?yàn)檫@些人太貴了;現(xiàn)在你可以用1美金一小時(shí),請一個(gè)AI法務(wù)幫你審合同,請一個(gè)AI財(cái)務(wù)幫你對賬,請一個(gè)AI市場幫你.......
當(dāng)然,它們目前替代不了資深專家。
所以,你發(fā)現(xiàn)沒有,1美金/小時(shí)的意義,超越了工業(yè)時(shí)代「省幾個(gè)人」的思維,它把過去不值得的事,變成了值得。
我看到一個(gè)報(bào)告的觀點(diǎn),當(dāng)模型能在編程、Agent、企業(yè)流程這些高ROI場景里,把「Token用量」穩(wěn)定轉(zhuǎn)化成「省人省時(shí)省返工」的交付價(jià)值時(shí),它就具備了穿越開源與價(jià)格戰(zhàn)的能力。
換句話說,幫企業(yè)算得過賬的AI,才有護(hù)城河,Minimax M2.5做到了這一切。
04
當(dāng)這筆賬在所有行業(yè)都算得過時(shí),世界會(huì)發(fā)生什么?
我換個(gè)說法,當(dāng)SOTA級別的智能,變成像水電一樣按需取用的公共服務(wù),誰會(huì)被托起來?
你可以想象一個(gè)印尼的大學(xué)生,他學(xué)編程,但買不起正版課程,請不起一對一輔導(dǎo)。
現(xiàn)在他花1美金,讓M2.5給他當(dāng)助教:代碼報(bào)錯(cuò)了,貼進(jìn)去問;算法看不懂,讓AI用印尼語講一遍;想做個(gè)小項(xiàng)目賺外快,AI幫他搭框架、寫文檔。
1美金,他打一天零工能掙5美金,夠AI干五小時(shí)。
你可以想象一個(gè)肯尼亞的創(chuàng)業(yè)者,他在內(nèi)羅畢做跨境電商,想從中國進(jìn)貨,但看不懂中文的商品描述;以前他得花高價(jià)請人翻譯,現(xiàn)在把鏈接扔給AI,英文版規(guī)格參數(shù)、物流條款、售后政策,幾分鐘就出來了。
1美金,他能把十家中國供應(yīng)商的資料翻個(gè)遍。
你還可以想象一個(gè)巴西的自由職業(yè)者;她在圣保羅接歐美的設(shè)計(jì)單子,以前只能做視覺部分,因?yàn)槲陌敢糜⒄Z寫,她搞不定;現(xiàn)在她用AI寫提案、寫郵件、寫設(shè)計(jì)說明,接單范圍從拉美擴(kuò)大到全球。
1美金,它打開了一個(gè)以前進(jìn)不去的市場;這些不是科幻片,它們是1美金/小時(shí)落地之后,一定會(huì)發(fā)生的場景。
所以,你看,1美金在硅谷意味著便宜到忽略不計(jì),但在雅加達(dá)、在內(nèi)羅畢、在圣保羅,它意味著另一件事:第一次用得起和硅谷公司一樣的AI能力。
這聽起來像「技術(shù)普惠」的陳詞濫調(diào),但它是真的。
歷史反復(fù)證明一件事:每一次基礎(chǔ)設(shè)施的平民化,都會(huì)催生一批我們想象不到的新物種。
印刷術(shù)變便宜時(shí),沒人想到會(huì)催生報(bào)紙和小說;互聯(lián)網(wǎng)變便宜時(shí),沒人想到會(huì)催生電商和短視頻;云計(jì)算變便宜時(shí),沒人想到會(huì)催生SaaS創(chuàng)業(yè)的黃金十年。
我真的感嘆,現(xiàn)在輪到AI了。
1美金/小時(shí),是起點(diǎn)。Minimax M2.5在告訴我們一件事,AI正在從奢侈品變成日用品,從稀缺資源變成基礎(chǔ)設(shè)施。
當(dāng)一種資源變得像水和電一樣便宜時(shí),用它來做什么,就是想象力的問題。所以,別只盯著M2.5的跑分,1美金/小時(shí),才是這次發(fā)布真正的信號。
那問題來了:當(dāng)智能像水電一樣流進(jìn)千家萬戶,你想用它來做什么?春節(jié)有空時(shí)想想看。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.