![]()
當AI成為科技行業的核心生產力,一場關于"Token"的瘋狂競賽正在硅谷上演。Meta內部員工自發搭建的"Claudeonomics"排行榜,讓8.5萬名員工卷入Token消耗大賽,單月燒掉60萬億Token,價值約9億美元。從高管公開支持到員工爭相攀比,"燒Token"儼然成為新的KPI和身份象征。然而,這場看似繁榮的算力狂歡背后,隱藏著巨大的資源浪費與效率困境。隨著智能體(Agent)時代到來,Token消耗模式發生結構性變化,行業正從"越多越好"的粗放增長,轉向"越準越好"的精耕細作,一場關于算力效率的革命正在悄然展開。
一、Meta的Token狂歡:當燒錢成為新KPI
在Meta公司內部,一場別開生面的競賽正火熱進行。員工自發在內網創建的"Claudeonomics"排行榜,實時追蹤著全員的AIToken消耗情況。這個以Anthropic旗艦產品Claude命名的榜單,匯聚了8.5萬名員工的數據,列出Token消耗量最高的前250名。
榜單設計得如同游戲競技:排名靠前的員工可獲得銅、銀、金、鉑金到翡翠的等級徽章,以及"模型鑒賞家""緩存巫師"等趣味頭銜。而站在金字塔頂端的人,則被冠以"Session永生者""Token傳奇"的稱號,成為公司內的AI明星。
數據令人咋舌:過去30天,Meta員工累計消耗Token超60萬億。按AnthropicClaudeOpus4.6模型每百萬Token15美元的價格估算,總成本約9億美元。個人消耗榜首更是達到驚人的2810億Token,價值數百萬美元。
更值得關注的是,這種"Token最大化"文化已獲得管理層背書。MetaCTOAndrewBosworth公開表示,頂尖工程師將相當于年薪的金額用于Token消耗,生產力可提升10倍,"這筆交易成果顯而易見,應持續投入,沒有上限"。英偉達CEO黃仁勛更是直言不諱:"如果一名年收入50萬美元的工程師每年在AIToken上花費少于25萬美元,我會深感擔憂"。
在硅谷,"燒Token"已成為新的職場炫耀資本和能力證明。員工們為提升排名,讓AI代理長時間閑置運行、頻繁發起無意義調用。這種"人工數據膨脹"行為,將Token消耗異化為單純的數字游戲,而非真正的生產力提升。
二、Token≠生產力:被誤讀的效率指標
這場Token狂歡引發廣泛質疑。彭博社記者JoeWeisenthal在X平臺嘲諷:"用Token總消耗量衡量生產力有何意義?這就像'后院煉鋼爐',一味追求數字而忽視質量"。
![]()
根本問題在于:Token消耗是投入指標,而非產出指標。就像用打印頁數衡量員工生產力,消耗更多Token并不等同于取得更多成果。
智能體(Agent)的興起讓問題更加復雜。以OpenClaw為代表的新一代AI系統,不再是簡單對話工具,而是能持續執行任務、主動調用工具、自行拆解目標的自動化系統。它像"不下班的執行單元",任務啟動后在后臺長時間運轉,反復推理、調用、修正。
這種轉變徹底改變了成本結構:一次簡單自動化流程,可能拆分成數十甚至上百次模型調用;一次"讓AI自己完成"的指令,背后是長時間推理和連續Token流水。大量消耗來自模型內部推理,而非用戶直接需求。
更嚴重的是,當前許多Agent系統效率低下,像經驗不足的執行者,需要反復確認、多次修正。原本少數步驟可完成的任務,被拉長為高冗余流程。Token消耗增長,更多反映系統控制能力不足,而非智能水平提升。
行業長期存在"更強智能必須建立在更高算力消耗上"的假設。從GPT-3到GPT-4,通過更大模型、更長上下文、更復雜推理鏈換取能力提升。這種路徑依賴延伸到Agent系統,演變為"用更多調用換更高成功率"的實踐慣性,推動行業走向隱性算力競賽。
三、效率革命:從"燒得多"到"用得準"
當Token競賽逼近可持續邊界,行業開始反思:真正的AI進步,不在于"用得多",而在于"用得準"。Agent競爭正從"誰消耗更多資源"轉向"誰更高效使用資源"。
1.模型與提示詞優化:減少無效消耗
最簡單高效的方式是優化交互方式。行業已總結出實用技巧:
精簡提示詞:將500字提示壓縮到180字,Token消耗可降64%,質量基本不變
禁用冗余表達:要求AI"不要寒暄、不要解釋、直接給答案",減少輸出浪費
對話管理:任務完成開啟新對話,避免歷史上下文累積導致成本上升
啟用緩存:重復內容只付一次費,Anthropic緩存價格僅為正常1/10
2.智能路由:把算力花在刀刃上
不同任務需不同能力模型,"殺雞用牛刀"是最大浪費。智能模型路由系統可自動分配:簡單任務用低成本輕量級模型,復雜任務才調高性能模型。這種策略可降低成本50%以上。
3.架構革新:從根源提升效率
Anthropic提出革命性方案:將"模型直接調用工具"改為"模型編寫代碼調用工具"。通過MCP協議,把工具封裝為代碼文件,讓AI生成代碼執行任務。實測將典型任務Token消耗從15萬降至2000,節省98.7%成本。
4.Token工廠:基礎設施效率革命
無問芯穹CEO夏立雪提出"Token工廠"理念:與其擴張算力,不如把現有資源用到極致。通過技術打通不同芯片和算力集群,實現軟硬件協同優化。
"Token工廠"不是簡單堆砌服務器,而是從"為人設計"到"為AI設計"的底層重構。它像超級調度中心,將分散算力池化成統一資源,毫秒級分配給最合適任務,讓GPU利用率從15%-30%提升至更高水平。
四、未來已來:高效AI時代的新圖景
Token效率革命正重塑AI行業發展邏輯,帶來三大深遠變化:
1.成本曲線非線性優化
行業一直假設"更強模型必然更貴",但效率優化打破此魔咒。高效訓練的小模型,可能比參數更大但低效的大模型更強、更省。AI能力提升不再唯算力論。
2.算力瓶頸轉向效率瓶頸
當GPU利用率僅15%-30%時,問題不在算力不足,而在利用不充分。通過系統優化,現有硬件可釋放數倍潛力。行業競爭焦點從"誰有更多GPU"轉向"誰能用好每一塊GPU"。
3.AI民主化加速
只有成本降至足夠低,AI才能從巨頭專利變為全民可用工具。Token效率革命讓AI從昂貴奢侈品變成普惠基礎設施,每一分算力被珍視,每一次調用有價值。
五、從野蠻生長到精耕細作
Meta的Token狂歡是AI發展的必經階段,反映行業從技術探索向規模化落地的轉型陣痛。當"燒Token"成為KPI,我們必須清醒:真正的AI價值,不在于消耗多少資源,而在于創造多少成果。
未來屬于那些能用更少Token完成更復雜任務的創新者。從"越多越好"到"越準越好",從粗放擴張到精耕細作,這場效率革命不僅是成本控制,更是AI發展范式的根本轉變。
當行業真正理解Token經濟學的核心——效率為王,AI才能擺脫資源競賽陷阱,走向可持續、普惠的未來。那時,Token不再是攀比數字,而是真正驅動創新、創造價值的核心燃料。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.