網易首頁 > 網易號 > 正文申請入駐

硅谷Token焦慮蔓延：燒得越多越厲害，打工人被逼瘋

2026-04-20 12:31:44　來源: 魏家東

北京舉報

分享至

當AI成為科技行業的核心生產力，一場關于"Token"的瘋狂競賽正在硅谷上演。Meta內部員工自發搭建的"Claudeonomics"排行榜，讓8.5萬名員工卷入Token消耗大賽，單月燒掉60萬億Token，價值約9億美元。從高管公開支持到員工爭相攀比，"燒Token"儼然成為新的KPI和身份象征。然而，這場看似繁榮的算力狂歡背后，隱藏著巨大的資源浪費與效率困境。隨著智能體（Agent）時代到來，Token消耗模式發生結構性變化，行業正從"越多越好"的粗放增長，轉向"越準越好"的精耕細作，一場關于算力效率的革命正在悄然展開。

一、Meta的Token狂歡：當燒錢成為新KPI

在Meta公司內部，一場別開生面的競賽正火熱進行。員工自發在內網創建的"Claudeonomics"排行榜，實時追蹤著全員的AIToken消耗情況。這個以Anthropic旗艦產品Claude命名的榜單，匯聚了8.5萬名員工的數據，列出Token消耗量最高的前250名。

榜單設計得如同游戲競技：排名靠前的員工可獲得銅、銀、金、鉑金到翡翠的等級徽章，以及"模型鑒賞家""緩存巫師"等趣味頭銜。而站在金字塔頂端的人，則被冠以"Session永生者""Token傳奇"的稱號，成為公司內的AI明星。

數據令人咋舌：過去30天，Meta員工累計消耗Token超60萬億。按AnthropicClaudeOpus4.6模型每百萬Token15美元的價格估算，總成本約9億美元。個人消耗榜首更是達到驚人的2810億Token，價值數百萬美元。

更值得關注的是，這種"Token最大化"文化已獲得管理層背書。MetaCTOAndrewBosworth公開表示，頂尖工程師將相當于年薪的金額用于Token消耗，生產力可提升10倍，"這筆交易成果顯而易見，應持續投入，沒有上限"。英偉達CEO黃仁勛更是直言不諱："如果一名年收入50萬美元的工程師每年在AIToken上花費少于25萬美元，我會深感擔憂"。

在硅谷，"燒Token"已成為新的職場炫耀資本和能力證明。員工們為提升排名，讓AI代理長時間閑置運行、頻繁發起無意義調用。這種"人工數據膨脹"行為，將Token消耗異化為單純的數字游戲，而非真正的生產力提升。

二、Token≠生產力：被誤讀的效率指標

這場Token狂歡引發廣泛質疑。彭博社記者JoeWeisenthal在X平臺嘲諷："用Token總消耗量衡量生產力有何意義？這就像'后院煉鋼爐'，一味追求數字而忽視質量"。

根本問題在于：Token消耗是投入指標，而非產出指標。就像用打印頁數衡量員工生產力，消耗更多Token并不等同于取得更多成果。

智能體（Agent）的興起讓問題更加復雜。以OpenClaw為代表的新一代AI系統，不再是簡單對話工具，而是能持續執行任務、主動調用工具、自行拆解目標的自動化系統。它像"不下班的執行單元"，任務啟動后在后臺長時間運轉，反復推理、調用、修正。

這種轉變徹底改變了成本結構：一次簡單自動化流程，可能拆分成數十甚至上百次模型調用；一次"讓AI自己完成"的指令，背后是長時間推理和連續Token流水。大量消耗來自模型內部推理，而非用戶直接需求。

更嚴重的是，當前許多Agent系統效率低下，像經驗不足的執行者，需要反復確認、多次修正。原本少數步驟可完成的任務，被拉長為高冗余流程。Token消耗增長，更多反映系統控制能力不足，而非智能水平提升。

行業長期存在"更強智能必須建立在更高算力消耗上"的假設。從GPT-3到GPT-4，通過更大模型、更長上下文、更復雜推理鏈換取能力提升。這種路徑依賴延伸到Agent系統，演變為"用更多調用換更高成功率"的實踐慣性，推動行業走向隱性算力競賽。

三、效率革命：從"燒得多"到"用得準"

當Token競賽逼近可持續邊界，行業開始反思：真正的AI進步，不在于"用得多"，而在于"用得準"。Agent競爭正從"誰消耗更多資源"轉向"誰更高效使用資源"。

1.模型與提示詞優化：減少無效消耗

最簡單高效的方式是優化交互方式。行業已總結出實用技巧：

精簡提示詞：將500字提示壓縮到180字，Token消耗可降64%，質量基本不變

禁用冗余表達：要求AI"不要寒暄、不要解釋、直接給答案"，減少輸出浪費

對話管理：任務完成開啟新對話，避免歷史上下文累積導致成本上升

啟用緩存：重復內容只付一次費，Anthropic緩存價格僅為正常1/10

2.智能路由：把算力花在刀刃上

不同任務需不同能力模型，"殺雞用牛刀"是最大浪費。智能模型路由系統可自動分配：簡單任務用低成本輕量級模型，復雜任務才調高性能模型。這種策略可降低成本50%以上。

3.架構革新：從根源提升效率

Anthropic提出革命性方案：將"模型直接調用工具"改為"模型編寫代碼調用工具"。通過MCP協議，把工具封裝為代碼文件，讓AI生成代碼執行任務。實測將典型任務Token消耗從15萬降至2000，節省98.7%成本。

4.Token工廠：基礎設施效率革命

無問芯穹CEO夏立雪提出"Token工廠"理念：與其擴張算力，不如把現有資源用到極致。通過技術打通不同芯片和算力集群，實現軟硬件協同優化。

"Token工廠"不是簡單堆砌服務器，而是從"為人設計"到"為AI設計"的底層重構。它像超級調度中心，將分散算力池化成統一資源，毫秒級分配給最合適任務，讓GPU利用率從15%-30%提升至更高水平。

四、未來已來：高效AI時代的新圖景

Token效率革命正重塑AI行業發展邏輯，帶來三大深遠變化：

1.成本曲線非線性優化

行業一直假設"更強模型必然更貴"，但效率優化打破此魔咒。高效訓練的小模型，可能比參數更大但低效的大模型更強、更省。AI能力提升不再唯算力論。

2.算力瓶頸轉向效率瓶頸

當GPU利用率僅15%-30%時，問題不在算力不足，而在利用不充分。通過系統優化，現有硬件可釋放數倍潛力。行業競爭焦點從"誰有更多GPU"轉向"誰能用好每一塊GPU"。

3.AI民主化加速

只有成本降至足夠低，AI才能從巨頭專利變為全民可用工具。Token效率革命讓AI從昂貴奢侈品變成普惠基礎設施，每一分算力被珍視，每一次調用有價值。

五、從野蠻生長到精耕細作

Meta的Token狂歡是AI發展的必經階段，反映行業從技術探索向規模化落地的轉型陣痛。當"燒Token"成為KPI，我們必須清醒：真正的AI價值，不在于消耗多少資源，而在于創造多少成果。

未來屬于那些能用更少Token完成更復雜任務的創新者。從"越多越好"到"越準越好"，從粗放擴張到精耕細作，這場效率革命不僅是成本控制，更是AI發展范式的根本轉變。

當行業真正理解Token經濟學的核心——效率為王，AI才能擺脫資源競賽陷阱，走向可持續、普惠的未來。那時，Token不再是攀比數字，而是真正驅動創新、創造價值的核心燃料。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.