![]()
新智元報道
![]()
【新智元導讀】亞馬遜給員工的AI工具裝了計量器,官方說不考核,經理盯著排行榜不放。Meta內部榜單30天燒掉60萬億token,扎克伯格沒進前250。然而Jellyfish數據打臉:刷10倍token,產出只多了1倍。誰在為這場荒誕游戲推波助瀾?
硅谷大廠,開始流行用token摸魚了?
英國《金融時報》近日報道,亞馬遜的一些員工,正坐在工位上讓一個叫MeshClaw的內部AI工具,跑那些根本沒必要的任務。
他們不是在搞實驗,也不是趕項目,而是在刷token。
MeshClaw能發郵件、處理Slack、部署代碼,是一個真正可以「代勞」的AI智能體。據報道,亞馬遜還給它配了一張內部排行榜,實時追蹤每位員工的token消耗量,目標是超過80%的開發者每周都在用AI。
3名知情人士透露,部分員工隨即找到了新的生存策略:用MeshClaw跑沒有必要的任務,專門為了拉高榜單上的數字。
在硅谷,這個行為有了專屬名詞:tokenmaxxing(瘋狂刷AI用量)。
亞馬遜說token數據不用于績效評估。但據報道,多名員工并不相信,有人直言感受到「很大壓力」,而且不只是要用AI,還要用得「最多」。
亞馬遜不是唯一一家。Meta內部排行榜「Claudeonomics」(Claude經濟學)過去一個月燒了60萬億token,扎克伯格本人都沒排進前250。
這是2026年5月,全球最有錢的幾家公司同時進入了一種新的工作狀態。大廠AI開始淪為一種KPI游戲。
Jassy的備忘錄
員工讀出了另一層意思
MeshClaw是亞馬遜給員工的AI入口,它背后接的是Claude。
亞馬遜推AI的力度有目共睹。據報道,公司設定了一個內部目標:超過80%的開發者每周必須用上AI工具,并配套上線了內部排行榜,追蹤每個人的token消耗量。
初衷當然是好的,但一到員工手里就變形了。問題也不全在員工這里,token焦慮的源頭其實還在公司最高層。
2025年6月,亞馬遜CEO Andy Jassy向全體員工發出了一封公開備忘錄,直接建議員工「只要有機會,就去使用和實驗AI」。他還寫道,那些擁抱AI轉變的人,將「處于更有利的位置,產生高影響力」。
![]()
https://www.aboutamazon.com/news/company-news/amazon-ceo-andy-jassy-on-generative-ai
![]()
Jassy的備忘錄中,「對AI保持好奇……只要有機會就用AI、試AI」這句話被員工讀出了另一層意思:tokenmaxxing。
Jassy在備忘錄中將「擁抱AI」與「產生高影響力」直接掛鉤,讓每一個普通員工陷入一種token焦慮:我現在的AI使用量,夠不夠?
更關鍵的是,Jassy還在同一封備忘錄里寫明:未來幾年,隨著在公司范圍內廣泛使用AI,亞馬遜預計企業員工規模將下降。
亞馬遜官方表示token數據不會用于績效評估,但據員工透露,經理仍然在盯著排行榜。在這種氛圍不言而喻:誰的token用得多,誰就更安全。
于是,本來不需要AI的活兒,也要丟給AI跑一遍,為的就是讓榜單上的數字好看。
這正是互聯網OKR體系下經典的反向打卡,員工在跟一個量化指標博弈。
Meta 更離譜,CTO 親自喊「刷」
Meta,在同一周也被《The Information》曝光了內部AI排行榜。
一位叫Ash Bhat的員工獨立搭了個名為「Claudeonomics」的工具,該儀表盤追蹤約8.5萬名員工的token使用量,并以排行榜形式展示,30天累計消耗60萬億token,單個頂級用戶燒了2810億token。
有趣的是,扎克伯格本人沒進前250,CTO Andrew Bosworth也沒進。
![]()
排行榜被媒體報道之后,作者主動把它下線了。但Bosworth隨即在Forbes上公開站臺:公司最優秀的工程師,花掉相當于自己一年工資的token,效率卻提升了5到10倍。「這就像白送錢,繼續刷,不設上限。」
無論是員工被迫,還是CTO真心鼓勵,亞馬遜和Meta這兩家全球最有錢的公司,都已經把tokenmaxxing變成了一種企業文化。
也不只這些知名大廠,企業AI平臺公司Writer的CEO May Habib在接受《華爾街日報》采訪時,坦率承認了三件事:token是可以被「刷」的指標,員工會用公司平臺做私人項目,并非每一個token都在創造商業價值。
這些她全知道,但她的態度仍然是要推:
一旦你開始計算單個智能體行為的投資回報率,你就永遠不會真正用起來了。
Writer內部排行榜的月度冠軍消耗量接近110億token,亞軍超過60億。Habib公開表示自己在盯著這張榜看。
紅杉資本合伙人Sonya Huang更是直言:「我們都應該tokenmaxxing。」
Huang說,排行榜是個不完美的指標,她承認,「但對你的公司來說真正重要的問題是:我的員工有沒有徹底轉變成AI原住民?要做到這一點,你需要讓他們進入這種tokenmaxxing的狀態。」
所以爭論的本質并非「榜單好不好」,而是在什么規模和階段、對誰有效。
對Writer這樣幾十人的初創,CEO親自盯榜點名表揚,那是文化信號,效果直接。
對Jellyfish追蹤的12000名開發者,token榜變成了一個大家都知道在玩、但都不愿明說的游戲。
而亞馬遜有數十萬名員工,游戲的規模完全不同,副作用也完全不同。
10倍token
只換來2倍產出
很快,就有數據來打臉這種token榜單的刷榜行為。
工程智能公司Jellyfish對12000名開發者、200家企業的Q1 2026數據做了分析。
他們得出一個扎心數據:
最高使用層的開發者在每個PR上消耗的token約為中位數的10倍,但PR吞吐量只達到約2倍左右。
燒了10倍的油,只跑了2倍的路。
![]()
Jellyfish數據:token用量最高組產出是最低組的2.8倍,但每PR消耗token相差近千倍。燒更多token,換來的產出遠不成比例。
成本數字則更是刺眼。
Jellyfish用Claude API公開定價做了估算:中位數開發者每月在AI編程上花約52美元;到了90百分位的高用量用戶,這個數字跳到691美元。
每條PR的token成本,從最低用量層的0.28美元,直接飆升到最高用量層的89.32美元。
同一項工作,有人花了0.28美元完成,有人花了89美元,而且后者做出來的也并沒有好多少。
Jellyfish的AI研究負責人Nicholas Arcolano直言:「CFO已經開始追責了。客戶愿意為AI花錢,但不能不拿出負責任花費的證明。」
他還舉了一個看似高效、實則荒誕的例子:
我讓五個AI智能體各自做一個版本,然后挑最好的。大量工作被扔掉。可能整體上還是比人做便宜,但比直接做一次貴多了。
工程分析平臺Faros.ai上關于22000名開發者的數據,剛好補上了故事的另一半。
AI工具確實讓代碼產出提速了:任務完成量上升34%,完整功能模塊(epic)交付量上升66%。但同期,每位開發者的bug數量增加了54%,代碼審查時間升至約5倍,代碼返工率(code churn,即刪除行與新增行之比)在高AI采用環境下上升了驚人的861%。
指標在飛漲,效率卻并沒有跟上。
這就是經濟學里著名的Goodhart定律在現實中的一個樣本:當一個衡量指標變成了目標,它就不再是可靠的衡量指標了。
token消耗量變成KPI的那一刻,它就失去了作為效率代理指標的意義。
D.A. Davidson的科技研究主管Gil Luria對Fortune表示:「你設計什么激勵,就會得到什么行為。你告訴人們多用某種資源就能成功,他們當然會多用……這看起來不太健康。」
每刷一個token
都在給資本背書
跳開token使用者的視角,還有一層邏輯值得注意。
亞馬遜、微軟、谷歌、Meta這四家超大規模云廠商,2026年的合并資本開支已經逼近7000億美元,部分華爾街機構預測2027年將突破1萬億美元。
這是人類歷史上單一技術方向上最大規模的一次集體押注。
這筆錢當然要有個說法,這也是投資者要問的第一個問題:錢花在了哪里,需求是真實的嗎?
今年4月,Anthropic宣布擴大與亞馬遜的合作,承諾未來十年向AWS技術投入超過1000億美元,用于訓練和運行Claude。
目前,超過10萬家企業客戶通過Amazon Bedrock運行Claude。Anthropic的年化營收已超過300億美元,從2025年底的約90億美元快速增長。
![]()
2026年4月,Anthropic宣布擴大與亞馬遜合作,承諾十年向AWS投入逾1000億美元。
在這個結構里,亞馬遜既是Anthropic的最大投資者,也是其最重要的云基礎設施提供商,還是Claude最大的企業分發渠道之一。
Luria將這種關系稱作:「循環活動(circular activity)」。
同一批大公司投資了AI的上游供應商,把算力賣給外部客戶,同時也在內部瘋狂消耗自己的算力。內部token使用量的增長,既是員工被推著用的結果,也在客觀上成為「AI基建投資物有所值」的佐證。
從這個角度來說,員工刷的每一個token,都在給資本開支的合理性背書。
Arcolano給出了他認為正確的路徑:不要追求少數人的極限用量,要把更多人推到曲線的中間地帶。
廣泛、適度、持續的AI采用,比少數人的極端消耗更劃算,也更可持續。他建議管理者換一個指標:別看token總量,看每條PR消耗了多少token。
Arcolano提到的是一種精細化視角,但資本敘事往往是更為粗放的。
我們正處在這樣一個奇特時刻:AI工具確實在提升生產力,數據已經證明了這一點;但圍繞AI使用率建立的激勵體系,正在以難以察覺的方式,扭曲這一切。
Goodhart定律在上個世紀就有人提出了,但每一次技術變革,每隔一段時間,它就會找到一種新的表現形式,這一次的主角是token。
參考資料:
https://fortune.com/2026/05/12/amazon-tokenmaxxing-claude-ai-capex-meta-gil-luria/%20
https://www.ft.com/content/8ee0d3ef-9548-422d-8ff1-ebd48ad4b2ca%20
https://www.businessinsider.com/ai-tokenmaxxing-fails-as-productivity-strategy-jellyfish-2026-5%20
https://jellyfish.co/blog/is-tokenmaxxing-cost-effective-new-data-from-jellyfish-explains/%20
https://www.faros.ai/blog/tokenmaxxing
編輯:元宇
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.