<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      算力經濟學的邏輯,在Agent時代徹底改寫了

      0
      分享至



      4月4日,忍耐了許久的Anthropic,終于宣布切斷了第三方客戶端掛在Claude Pro/Max訂閱賬號的通路。

      這一舉動瞬間在開發者社區激起了軒然大波。不少習慣了通過OpenClaw和OpenCode等代理工具薅官方訂閱羊毛的用戶對此表示極為不滿,畢竟,為數不多的幾條通往國際頂級大模型的“低價高速”又少了一條。

      兩天之后,小米AI團隊的羅福莉發布了一篇關于Mimo Token Plan的推文,批判了當前智能體行業中算力分配的亂象。


      兩家AI公司的彼此獨立的商業動作,異口同聲地揭示了一個不易發現的行業真相:

      大模型正在從互聯網免費午餐的幻覺中退場,回歸作為稀缺能源的物理本質。

      01

      訂閱制的崩塌

      一個擺在眼前的事實是:算力的“大鍋飯”,已經供不起爆發兩個多月的智能體了。

      在傳統的SaaS時代,訂閱制就是互聯網公司商業文明的基石。

      無論是著名的Netflix,還是以前幾乎每個人電腦中都必須安裝的Office 365,商業邏輯都是一樣的:“用大多數人的閑置來補貼極少數的重度用戶”。

      但在如今的智能體時代,這個邏輯已經失效。

      羅福莉在推文中隱含了一個深刻的洞察:在當前的算力成本下,低廉的token價格、高強度的使用頻率和第三方代理的完全開放,構成了一個不可能三角。

      對于幾個月前的大語言模型,傳統的對話式使用(Chatbot)受到人類輸入和閱讀的速度限制,單次會話的Token消耗基本存在一個明確的上限。

      但Agent毫無征兆地徹底打破了這個博弈規則。

      一個像OpenClaw這樣的編程代理,想要執行任務就必須進行高頻的環境感知和工具調用。

      越復雜的任務,模型需要記住的內容就越多,在真實應用場景下,隱藏在每一次微小修改背后的,可能是超過上百萬的token消耗。

      如果把訂閱制比作健身房的會員卡,過去的用戶只是偶爾去運動一個小時打個卡。

      但現在的智能體用戶,就是帶著一群大胃王去吃自助餐,而且每個人的胃都是無底洞。

      按照目前Claude Opus 4.6的API價格,輸入端5美元/百萬token,輸出端25美元/百萬token,一個深度開發者通過第三方代理進行短短幾個小時的重度編程,實際消耗的token價值可能輕而易舉地消耗上百美元。

      結論顯而易見,Anthropic賣出一份幾十或是上百美元的訂閱,不僅不賺錢,甚至要虧損不少算力成本。

      Anthropic在正式切斷第三方接入之前,已經不止一次封禁各種渠道的外部訂閱,而Google的Antigravity和OpenAI的Codex也同樣有類似的操作。

      本質上,這就是AI企業不約而同的一次商業化止損,防止訂閱制被智能體帶來的算力黑洞徹底吞噬。

      國內的AI企業當然也不能幸免。

      今年3月起,智譜、阿里、騰訊等企業推出的Coding Plan訂閱服務陸續宣布大幅度漲價。

      短短一周之內,和此前的外賣大戰如出一轍的低價獲客活動就草草落幕。

      02

      計費模式的演進

      模型越變越強,用戶越來越多,AI行業的計費邏輯也正在經歷著從模糊到精確的演進,而這背后則是用戶付費認知與廠商成本壓力之間的博弈。

      ①明碼標價的API

      原生的API就是最初的工業級“電表”。

      API從AI行業走入人們視野至今,一直都是最透明的計費方式,也是讓普通用戶最焦慮的方式。

      它和每家每戶的電表一樣實時跳動,每一句“你是誰”都在扣費。

      極其公平的計費方式,實際價格卻觸目驚心:


      Anthropic被全球用戶詬病的超高定價自然不必多說,但國內的AI巨頭們發布的旗艦模型API價格也絕對說不上便宜。

      價格門檻不僅阻礙了大規模的C端普及,B端用戶也不得不仔細考量本地部署的經濟效益。

      但在AI企業相繼推出訂閱服務之前,這就是用戶唯一能選擇的付費方式。

      也因此,開發者的每一次調用都伴隨著極大的“算力焦慮”,這種焦慮也扼殺了AI本該帶來的探索性嘗試。而更多的用戶,選擇繼續在網頁中與AI免費交流。

      ②隨處可見的Coding Plan

      面對這種付費欲望極低的困境,Coding Plan成為了變現的良機。

      雖然名稱各有不同,但目前國內外主流大模型幾乎全部推出了訂閱制的Coding Plan,這也是付費認知和成本壓力彼此妥協的最終產物。

      它通過“每5小時1200次請求”這樣的模糊規則,將算力包裝成了一種類似寬帶包月的服務。

      隨著Coding Agent的誕生,其價值逐步得以體現:它成功建立了一部分開發者用戶的付費習慣。

      這些程序員們成為了第一批吃螃蟹的人,他們開始在電腦上讓AI幫著編寫代碼、運行、調試、修復bug,而不是通過復制粘貼的方式頻繁切換窗口和網頁中的AI進行交互。

      不過,僅僅兩個月之后,這種計費方式的局限性也暴露出來:不透明。

      1200次請求,可不是用戶給AI發送消息的次數,而是調用模型的次數。

      用戶的1次提問,就會觸發幾次甚至幾十次的模型調用。完成一個任務需要幾次提問、幾次模型調用?沒人能說得清。

      除此之外,廠商為了控制成本,往往要在后端進行精細的流量控制,甚至在壓力過大時通過模型降級等方式來維持服務。

      這種計費模式,最終直接導致了用戶使用體驗的斷裂。對于專業開發者來說,一旦進入高強度的編程狀態,要么是發現AI突然降智,要么是因為多次對話達到頻率限制而不得不中斷。

      ③小米發布的Token Plan

      這是4天前小米剛剛推行的一套新的計費邏輯,也是羅福莉在推文中極力倡導的方案。

      值得注意的是,發布當天晚上,騰訊也推出了同樣的計費方式。

      與Coding Plan不同的是,它不再使用以次數為限制的虛無縹緲的承諾,而是像手機流量包的配額制一樣,明確告知用戶一個周期內套餐中能夠使用的token數量。

      當然,羅福莉作為小米AI團隊的代表,一篇推文的發布必然優先立足于小米的商業化利益。

      與此同時,如果只看旗艦模型,小米的MiMo-V2-Pro能力和國內第一梯隊的智譜、MiniMax、Kimi也拉不開太大的差距,但價格卻并不“親民”。定價表中“一杯咖啡”的價格,怕是給星巴克用戶專門定制的。


      但必須承認的是,這種計費方式是目前能夠兼顧算力緊缺現狀和商業利益的唯一解法,也是最符合貨幣經濟運行規律的方式。

      人們花錢購買生產資料,而產出的價值則取決于生產力。

      AI服務被量化為可預測的成本,“提效”的壓力也交還給了開發者。

      一個月前被賣到脫銷的Coding Plan已經告訴我們,在底層大語言模型的性能拉不開差距的情況下,一價定律在訂閱服務上是成立的。

      因此,可以預見,在4月接下來的幾周內,Token Plan即將接管新的token計費戰場。

      至于小米的模型能力到底對不對得起定價,市場競爭最終會給出公平的答案。

      03

      技術層面的反思

      高昂的API調用成本、限流限售的Coding Plan、再加上讓token進一步漲價的Token Plan,算力緊缺的問題從來沒有被根本解決,反而進一步籠罩了全球AI市場。

      以前AI巨頭們抱怨算力不夠,是因為規模化定律(Scaling Law)始終在發揮作用。

      在那個大語言模型跑分決定一切的年代(盡管就是幾個月以前),想要推出具有競爭力的新一代旗艦模型,算法、算力和數據就必須有所突破

      顯然,相比起算法,算力和數據的堆砌在工程上與投入呈明顯的正相關關系,只要有更好的數據和更多的芯片,模型就必然會更強大。

      但Agent時代,規模化定律雖然仍在生效,但效果已經不如先前顯著。

      如今的算力缺口,從訓練階段轉移到了推理階段,而Vibe Coding技術和以OpenClaw為代表的代理程序可謂是罪魁禍首。

      就像我之前的觀點一樣,OpenClaw等一眾桌面代理的出現創造了前所未有的偽需求。

      而推理階段中出現很大一部分算力缺口,就是因為其Agent框架設計粗糙,人為制造出了大量毫無必要且效能低下的交互。

      SGLang的核心貢獻者趙晨陽在4月6日發布的一篇文章中,把這種現象成為“用消防水龍頭澆花”。

      而起因是因為他在觀測現有的Agent框架實際產生的請求模式時,發現緩存命中率(Cache Hit Rate)慘不忍睹。

      這與羅福莉推文中提到的問題完全一致:目前的第三方Agent框架在上下文管理上表現得極其“懶惰”。

      為了在復雜任務中不會因為遺忘信息而脫離應用場景,Agent往往會在每一輪對話中都重新發送一次全量且未經優化的上下文。

      而在接近上下文窗口的上限時,大約每3步就會“破壞性”地壓縮一次工具響應信息。

      這種行為在工程角度來看最為直觀和簡便,但幾乎讓為推理引擎設計的提示詞緩存機制變得無效。

      趙晨陽的描述很符合目前AI行業軟硬件發展的現狀:

      硬件工程師拼命把HBM做大,推理引擎工程師拼命優化KV Cache內存布局,然后上層Agent框架以一種愚蠢的請求方式將資源揮霍殆盡。

      這就是各種Claw爆火的匪夷所思之處和商業邏輯:

      模型能力不足→靠Agent框架增加token消耗來彌補→token銷量增加→廠商漲價

      自工業革命以來,這套運行邏輯不符合任何技術演進的過程。

      這就好比有人設計了一輛極度費油、甚至一邊開一邊漏油的破車,駕駛者不僅沒能跑的更遠,反而因為浪費了大量燃油而推高油價。

      而現實已經證明,這種依靠低效堆砌換來的繁榮必然是虛假的:

      3月上旬安裝龍蝦成為凈賺幾百元的生意;

      3月中旬AI企業開始免費給用戶安裝龍蝦;

      3月下旬上門卸載龍蝦再次成為凈賺幾百元的生意;

      4月龍蝦在普通用戶中無人問津。

      羅福莉推文中說的一句話值得所有開發者牢記:

      痛苦最終會轉化為工程紀律。

      只有Token變貴到人們不能揮霍的程度,開發者才會有動力去思考:

      如何用更少的Token完成更多的任務。

      04

      算力不再是“免費午餐”

      人們總是在說,AI,或者說token,未來將會成為水和電一樣的生活基本資源。

      于是,AI行業內也普遍形成了一個共識,未來token的成本將會被打到一個極低的水平。

      但現實也如此嗎?

      至少目前的趨勢,是token在越來越貴。

      國內受限于芯片出口限制,算力必須作為“省著花”的存量資源;國外受限于電力基建和電網功能,算力變成了有上限的增量資源。

      在這種既需要算力加強基礎模型性能,又需要算力滿足爆發的推理需求的環境下,算力的供不應求已經不僅是AI企業需要考慮的問題,全球的AI用戶也必須承擔一部分經濟成本的壓力。

      也因此,Coding Plan幾周前的價格戰無需任何叫停的聲音就已經銷聲匿跡。

      按照火山引擎總裁譚待所說,國內智能體用戶的體量只有百萬級,而這已經能讓各大AI企業在短短一周之內接連漲價訂閱服務,核心原因仍然是:

      其中存在大量快速消耗token但產出價值極低的偽需求。當算力以大鍋飯的形式供給大眾時,這些偽需求就會快速擠占公共資源。

      于是,“精準配給制”理所應當地出現了。

      Google的Gemini API增加了付費優先級,小米和騰訊推出了價格更高的token訂閱服務,本質上都是在通過價格手段進行資源的最優配置。

      token使用量計費,正是要讓更具價值的token分配給能創造出更多價值的人。

      而這場算力經濟的變局,遲早要深刻影響每一個AI用戶的日常。

      在過去的二十年里,軟件工程的主旋律一直是“用空間換時間”和“用硬件換開發效率”。

      但在Agent時代,算力被抽象為token,顛覆了這套邏輯并成為了最昂貴的變量。

      未來的AI用戶,可能不會再有0門檻使用AI完成生產任務的機會,還必須做出一個艱難的二選一:

      要么有錢購買高價值token,要么懂得算力預算管理。

      也就是說,對于絕大部分人們,在使用AI時都必須有清醒的認知,并準確判斷一項任務值得調用什么水平的模型,甚至是一段上下文如何進行更有效地摘要和每一次工具調用是否是冗余的操作。

      或許不容易意識到,但我們已經被迫進入了一個算力精算的時代。

      不僅是開發者,每一個AI用戶都必須站在推理引擎、模型能力和業務價值的十字路口做出權衡。

      低效的用戶依靠暴力堆砌token,在頻繁的改錯和吵架中耗盡額度,最終和拒絕使用AI的人并無兩樣。

      而高效的用戶學會設計出更好的提示詞架構,用更聰明的調度方式讓模型在更短的上下文中給出答案。

      這場由Anthropic切斷第三方渠道引發的討論,已經給所有人敲響了警鐘:

      算力紅利接近枯竭,算力紀律已經降臨。

      我們必須接受高價值token正在變得昂貴而稀缺的現實,而且只能在這個現實中尋找新的工程最優解。

      羅福莉在推文的最后給出了一句結論:

      Agent時代不屬于燒算力最兇猛的人,而屬于利用算力最聰明的人。

      提高生產力的關鍵,絕不是規定每個員工一個月必須要用掉多少token這種滑稽的做法,而是如何把單位算力的智商產出比提升一個數量級,這才是Agent時代的入場券。

      至于通用人工智能(AGI),在現有的底層模型能力和Agent算法框架水平下,還只是春秋大夢。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      看浙江宣傳談“基本盤”的重要性

      看浙江宣傳談“基本盤”的重要性

      林中木白
      2026-05-13 13:33:25
      一季度失業保險基金支出536.6億元,同比增長15.4%

      一季度失業保險基金支出536.6億元,同比增長15.4%

      爆角追蹤
      2026-05-13 10:25:49
      美國總統訪華,路費食宿誰掏錢?

      美國總統訪華,路費食宿誰掏錢?

      黃娜老師
      2026-05-13 20:31:40
      NBA球隊老板手撕華裔女獵手:100億的仙人跳 搞砸了

      NBA球隊老板手撕華裔女獵手:100億的仙人跳 搞砸了

      慕容律師
      2026-05-13 14:15:09
      特朗普專機落地!抵達北京開啟訪華行程

      特朗普專機落地!抵達北京開啟訪華行程

      看看新聞Knews
      2026-05-13 20:44:02
      8年前擊敗北大碩士,拿下詩詞大會冠軍的外賣大叔,如今過得怎樣

      8年前擊敗北大碩士,拿下詩詞大會冠軍的外賣大叔,如今過得怎樣

      從零到一研究所
      2026-05-09 16:17:39
      深度|中東戰火燒痛印度,六天訪五國,緊急加上阿聯酋,莫迪要外交“救國”?

      深度|中東戰火燒痛印度,六天訪五國,緊急加上阿聯酋,莫迪要外交“救國”?

      上觀新聞
      2026-05-13 21:18:21
      “莫奈紫”變“摸奶子”,OPPO呼吸都是錯的

      “莫奈紫”變“摸奶子”,OPPO呼吸都是錯的

      梳子姐
      2026-05-13 19:46:10
      為什么去過朝鮮回來就沉默的人,不是隱瞞,是真的說不出

      為什么去過朝鮮回來就沉默的人,不是隱瞞,是真的說不出

      老特有話說
      2026-05-12 15:41:08
      豪門狂歡夜:國米2-0加冕雙冠 巴黎法甲五連冠 曼城3-0施壓阿森納

      豪門狂歡夜:國米2-0加冕雙冠 巴黎法甲五連冠 曼城3-0施壓阿森納

      狍子歪解體壇
      2026-05-14 05:17:47
      “摸奶子”惹爭議!OPPO的流量反噬來了?莫奈:我背鍋?!

      “摸奶子”惹爭議!OPPO的流量反噬來了?莫奈:我背鍋?!

      品牌新
      2026-05-13 17:03:19
      網傳華工男生在教室偷拍女生?校方:情況屬實,依規給予處分

      網傳華工男生在教室偷拍女生?校方:情況屬實,依規給予處分

      南方都市報
      2026-05-13 17:36:31
      “降噪耳機受害者出現”,沖上熱搜

      “降噪耳機受害者出現”,沖上熱搜

      觀察者網
      2026-05-13 09:31:15
      最后時刻,黃仁勛擠上飛向北京的“空軍一號”

      最后時刻,黃仁勛擠上飛向北京的“空軍一號”

      中國新聞周刊
      2026-05-13 20:56:03
      重磅!皇馬與穆帥敲定3年執教合同!只待本菲卡賽季結束后,官宣

      重磅!皇馬與穆帥敲定3年執教合同!只待本菲卡賽季結束后,官宣

      福醬的小時光
      2026-05-14 06:27:54
      陳麗華去世1個月,73歲遲重瑞現狀曝光,他果然不是“軟柿子”

      陳麗華去世1個月,73歲遲重瑞現狀曝光,他果然不是“軟柿子”

      攬星河的筆記
      2026-05-13 17:03:14
      女子吃霸王餐給差評:正臉曝光,自認為沒錯,要上媒體跟老板對質

      女子吃霸王餐給差評:正臉曝光,自認為沒錯,要上媒體跟老板對質

      閱微札記
      2026-05-13 14:31:03
      關心:黃仁勛為什么能“壓哨登機”

      關心:黃仁勛為什么能“壓哨登機”

      觀察者網
      2026-05-13 16:22:20
      山東首富換人,28億變1萬億,75歲老人干出全球光模塊龍頭

      山東首富換人,28億變1萬億,75歲老人干出全球光模塊龍頭

      毒sir財經
      2026-05-13 21:35:57
      民營:不能永遠帶著原罪的鐐銬前行

      民營:不能永遠帶著原罪的鐐銬前行

      生命可以承受之輕
      2026-05-12 08:50:45
      2026-05-14 08:07:00
      硅基星芒AI
      硅基星芒AI
      錦緞旗下人工智能研究與媒體服務平臺
      60文章數 7關注度
      往期回顧 全部

      科技要聞

      阿里年營收首破萬億,AI終于不再是畫大餅

      頭條要聞

      中東戰火燒痛印度 莫迪六天訪五國要外交“救國”

      頭條要聞

      中東戰火燒痛印度 莫迪六天訪五國要外交“救國”

      體育要聞

      14年半,74萬,何冰嬌沒選那條更安穩的路

      娛樂要聞

      白鹿掉20萬粉,網友為李晨鳴不平

      財經要聞

      美國總統特朗普抵達北京

      汽車要聞

      C級純電轎跑 吉利銀河"TT"申報圖來了

      態度原創

      家居
      健康
      教育
      時尚
      藝術

      家居要聞

      內在自敘,無域有方

      干細胞能讓人“返老還童”嗎

      教育要聞

      家長就讀,孩子免費修大學學分的社區大學?

      專欄 | 進入心流后,不被洪流裹挾

      藝術要聞

      這才是真正的“史上最強畢業證”,書法堪比字帖!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲精品乱码久久久久久自慰| 久久不射影院| 欧美色资源站| 国产日韩精品在线视频| 亚洲妇女黄色三级视频| 深夜福利啪啪片| 国产无码AV| 欧美中文字幕人妻系列| 少妇极品熟妇人妻200片| A片A级毛片| 亚洲人成网站18禁止无码| 欧美变态另类zozo| 日韩精品一区二区三区久| 亚洲无码卡一卡二| 99久久99精品久久久久久| 无码熟妇人妻AV影片在线| 国产精品福利自产拍在线观看| 免费无码午夜理论电影| 四虎跳转到新域名| 国产xxxxxxx| 亚洲AV优女天堂波多野结衣| 欧美热亚洲热中文字幕| 国产欧美日韩免费看AⅤ视频| 99在线 | 亚洲| 免费在线观看A| 狠狠人妻久久久久久综合蜜桃| 国产aaaaa一级毛片| 国产精品嫩草影院午夜| 超碰人人草| 丰满爆乳一区二区三区| 日本在线 | 中文| 91人妻中文字幕在线精品| 三级国产在线观看| 亚洲—本道 在线无码| 永久免费观看的毛片视频| 一色道久久88加勒比一| 一区二区偷拍美女撒尿视频| 少妇xxxxx性开放| 49vv亚洲欧美在线观看| 亚洲精品av在线| 精品国产AV无码一区二区三区|