昨天(4月16日),Anthropic發布了Claude Opus 4.7,OpenAI同天更新了Codex。
點開科技媒體,清一色"編程能力炸了"、"視覺三倍升級"、"白嫖式升級"。邊忙著爭論benchmark,順便把"OpenAI正面硬剛Anthropic"這種劇情講了一遍。
![]()
Claude Opus 4.7綜合基準對比
但我們發現有一件真正值得關注的事,沒幾個人注意到:同一天,AI的賬單邏輯被悄悄改了兩次。
一個2月份還能用50萬token搞定的任務,4月份同樣的活,可能要燒500萬token才能完成。
大部分用戶意想不到的AI漲價正在到來。
Tokenizer悄悄換了一把尺子
有個細節藏在Anthropic的官方指南里,我估計99%的讀者都跳過了。
原文是這樣的:
"Opus 4.7 uses an updated tokenizer that improves how the model processes text. The tradeoff is that the same input can map to more tokens—roughly 1.0–1.35× depending on the content type."
說人話就是,他們換了一把新尺子,同一段提示詞,過去量出來100個token,現在可能是130個。
Token相信用過AI的人經常都會聽說它,它就是AI理解提示詞的最小單位。
你問AI一句話,AI其實不是直接讀文字的,它先把文字切成一塊一塊、叫"token"的單位,再去處理。Tokenizer就是計量Token的工具。
問題來了。
定價沒動,還是5美元/百萬Token輸入、25美元/百萬Token輸出,但你的token計算憑空增加了,賬單自然就要變大。
假設一家公司每月在Opus 4.6上花100萬美元API費。切到4.7之后,同樣的工作量,賬單可能會悄悄爬到135萬,每月多出來幾十萬美元的開銷。
這個tokenizer變化大部分媒體都沒有注意到,因為大家都沒往下算賬。
這就是AI時代不知不覺的暗稅。
![]()
Anthropic官方給出的不同effort級別下token消耗與性能關系
AI的工作單位變了
如果說tokenizer是10-35%的溫柔刀,下面這件事才是真正的大殺器。
OpenAI在Codex發布會上做了一個演示,讓Codex自己寫一款賽車游戲。不同的賽車手、8張地圖、道具系統,都要。一個初始提示丟進去,Codex自己當設計師、程序員、測試員,玩完一遍游戲來驗證效果。
整個過程燒了700萬token。
對比一下。你用GPT-4問一個問題,一次大概消耗500到2000個token。
Codex一次任務就是過去單次調用的三千多倍。
![]()
OpenAI在4月16日Codex更新中展示的應用內瀏覽器界面
這不是OpenAI一家在做,Anthropic的合作伙伴Vercel在測試Opus 4.7時也報告說:
"Claude Opus 4.7 autonomously built a complete Rust text-to-speech engine from scratch—neural model, SIMD kernels, browser demo—then fed its own output through a speech recognizer to verify it matched the Python reference. Months of senior engineering, delivered autonomously."
翻譯過來就是,Opus 4.7自己寫了一套完整的Rust文字轉語音引擎,從神經網絡模型到SIMD底層優化,再到瀏覽器演示,全部自主完成。然后它把自己的輸出喂給語音識別器去驗證對不對。
這也不是某家AI公司的問題,而是AI發展的大趨勢。 今年1月,王煜全在前哨科技特訓營就和大家預告過這個趨勢,沒想到4月就已經發生。
![]()
1月前哨科技特訓營PPT報告
Bolt、Factory Droids、Genspark、Warp,幾乎每個測試過的企業都在說同一件事:現在的AI能連續干幾個小時、甚至一整天,中間不用人管。
Anthropic自己在博客里有句話很關鍵:"engineers shift from working 1:1 with agents to managing them in parallel"。工程師從"和一個AI對話",變成了"同時管著好幾個AI"。
AI的工作單位,已經從"一次回答"悄悄升級成了"一段工作"。
賬單暴漲,對人的要求就更高了
把兩件事放在一起算一筆賬。
你2月份在做一個自動生成產品文檔的活,今天升級到4.7,順便啟用新的Agent模式。
Tokenizer換了,同樣工作量的token數先乘1.3。Agent要自主跑多步流程,token再乘8,不知不覺這成本就漲上去了10倍。
這才是Claude 4.7和Codex同一天發布的真實劇情。
當然,到這里如果只討論"賬單漲了多少",其實還沒摸到最重要的那層。
AI廠商的商業模式,正在從"賣回答"轉成"賣工時"。
過去那種AI是工具屬性的。你問一句它答一句,按次計價,每次調用的邊界由你來畫。
現在這批AI更像是勞動力。你下一個目標,它自主工作幾個小時,按token消耗計價。工作邊界由AI自己決定。
三個影響,管理AI的高階手段
這事兒帶來的影響有三個層面。
一是預算方案直接失效。 過去企業AI預算怎么算?要么按席位數乘月費,要么按API調用次數。現在呢,同一個用戶、同一個調用,消耗量可以差100倍。
CFO拿到賬單才知道自己花了多少錢。OpenAI悄悄上線的那個"Codex按token付費席位",還有Anthropic剛推出的"Task Budgets",都是在試圖給這些大公司一點掌控感。
二是工程師的角色邊界要重新設定。 以前工程師是寫代碼的人,現在是管AI工作流的人。你得不停判斷:這個活值不值得讓AI燒100萬token去干?該用中等算力還是滿血狂奔?什么時候該打斷它?
這種決策過去根本不存在,現在每天要做幾十次。
三是能力差距會被繼續拉大。 同樣的AI工具,會用的人和不會用的人,產出能差10倍。不是AI變強了你就自動受益,你得學會怎么"管AI工時"這件事。
過去你會寫prompt就夠了。現在還得會管token預算、會挑effort級別、會拆任務粒度、會算AI工時的投入產出比。
這其實是一套類似項目管理的新技能,但99%的AI教程還卡在"怎么寫提示詞"這個老話題上。
不過"管AI"其實分兩種玩法。
低階玩法是管token預算、挑effort級別、算賬單ROI…這些讓你不虧。
高階玩法是另一件事:把你(或者你公司里最值錢的那個專家)裝進AI里。
公司里最資深的顧問、最懂客戶的銷售、最會踩風向的投資人,他們的經驗、判斷、方法論,如果能全部沉淀成一個AI版本的"他",整個團隊隨時調用,這才是AI作為勞動力真正的規模化價值。
不是替一個人干活,而是把一個人復制成一千個。
這件事怎么做?本周日前哨AI小課講。
AI會越來越像員工,但真正把AI用到極致的玩法,是讓它成為你和你團隊的"知識延伸"。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.