網易首頁 > 網易號 > 正文申請入駐

Claude 4.7炸裂發布！有個關乎用戶錢包的問題，大多數媒體都沒有發現！

2026-04-18 06:32:08　來源: 王煜全

北京舉報

分享至

昨天（4月16日），Anthropic發布了Claude Opus 4.7，OpenAI同天更新了Codex。

點開科技媒體，清一色"編程能力炸了"、"視覺三倍升級"、"白嫖式升級"。邊忙著爭論benchmark，順便把"OpenAI正面硬剛Anthropic"這種劇情講了一遍。

Claude Opus 4.7綜合基準對比

但我們發現有一件真正值得關注的事，沒幾個人注意到：同一天，AI的賬單邏輯被悄悄改了兩次。

一個2月份還能用50萬token搞定的任務，4月份同樣的活，可能要燒500萬token才能完成。

大部分用戶意想不到的AI漲價正在到來。

Tokenizer悄悄換了一把尺子

有個細節藏在Anthropic的官方指南里，我估計99%的讀者都跳過了。

原文是這樣的：

"Opus 4.7 uses an updated tokenizer that improves how the model processes text. The tradeoff is that the same input can map to more tokens—roughly 1.0–1.35× depending on the content type."

說人話就是，他們換了一把新尺子，同一段提示詞，過去量出來100個token，現在可能是130個。

Token相信用過AI的人經常都會聽說它，它就是AI理解提示詞的最小單位。

你問AI一句話，AI其實不是直接讀文字的，它先把文字切成一塊一塊、叫"token"的單位，再去處理。Tokenizer就是計量Token的工具。

問題來了。

定價沒動，還是5美元/百萬Token輸入、25美元/百萬Token輸出，但你的token計算憑空增加了，賬單自然就要變大。

假設一家公司每月在Opus 4.6上花100萬美元API費。切到4.7之后，同樣的工作量，賬單可能會悄悄爬到135萬，每月多出來幾十萬美元的開銷。

這個tokenizer變化大部分媒體都沒有注意到，因為大家都沒往下算賬。

這就是AI時代不知不覺的暗稅。

Anthropic官方給出的不同effort級別下token消耗與性能關系

AI的工作單位變了

如果說tokenizer是10-35%的溫柔刀，下面這件事才是真正的大殺器。

OpenAI在Codex發布會上做了一個演示，讓Codex自己寫一款賽車游戲。不同的賽車手、8張地圖、道具系統，都要。一個初始提示丟進去，Codex自己當設計師、程序員、測試員，玩完一遍游戲來驗證效果。

整個過程燒了700萬token。

對比一下。你用GPT-4問一個問題，一次大概消耗500到2000個token。

Codex一次任務就是過去單次調用的三千多倍。

OpenAI在4月16日Codex更新中展示的應用內瀏覽器界面

這不是OpenAI一家在做，Anthropic的合作伙伴Vercel在測試Opus 4.7時也報告說：

"Claude Opus 4.7 autonomously built a complete Rust text-to-speech engine from scratch—neural model, SIMD kernels, browser demo—then fed its own output through a speech recognizer to verify it matched the Python reference. Months of senior engineering, delivered autonomously."

翻譯過來就是，Opus 4.7自己寫了一套完整的Rust文字轉語音引擎，從神經網絡模型到SIMD底層優化，再到瀏覽器演示，全部自主完成。然后它把自己的輸出喂給語音識別器去驗證對不對。

這也不是某家AI公司的問題，而是AI發展的大趨勢。 今年1月，王煜全在前哨科技特訓營就和大家預告過這個趨勢，沒想到4月就已經發生。

1月前哨科技特訓營PPT報告

Bolt、Factory Droids、Genspark、Warp，幾乎每個測試過的企業都在說同一件事：現在的AI能連續干幾個小時、甚至一整天，中間不用人管。

Anthropic自己在博客里有句話很關鍵："engineers shift from working 1:1 with agents to managing them in parallel"。工程師從"和一個AI對話"，變成了"同時管著好幾個AI"。

AI的工作單位，已經從"一次回答"悄悄升級成了"一段工作"。

賬單暴漲，對人的要求就更高了

把兩件事放在一起算一筆賬。

你2月份在做一個自動生成產品文檔的活，今天升級到4.7，順便啟用新的Agent模式。

Tokenizer換了，同樣工作量的token數先乘1.3。Agent要自主跑多步流程，token再乘8，不知不覺這成本就漲上去了10倍。

這才是Claude 4.7和Codex同一天發布的真實劇情。

當然，到這里如果只討論"賬單漲了多少"，其實還沒摸到最重要的那層。

AI廠商的商業模式，正在從"賣回答"轉成"賣工時"。

過去那種AI是工具屬性的。你問一句它答一句，按次計價，每次調用的邊界由你來畫。

現在這批AI更像是勞動力。你下一個目標，它自主工作幾個小時，按token消耗計價。工作邊界由AI自己決定。

三個影響，管理AI的高階手段

這事兒帶來的影響有三個層面。

一是預算方案直接失效。 過去企業AI預算怎么算？要么按席位數乘月費，要么按API調用次數。現在呢，同一個用戶、同一個調用，消耗量可以差100倍。

CFO拿到賬單才知道自己花了多少錢。OpenAI悄悄上線的那個"Codex按token付費席位"，還有Anthropic剛推出的"Task Budgets"，都是在試圖給這些大公司一點掌控感。

二是工程師的角色邊界要重新設定。 以前工程師是寫代碼的人，現在是管AI工作流的人。你得不停判斷：這個活值不值得讓AI燒100萬token去干？該用中等算力還是滿血狂奔？什么時候該打斷它？

這種決策過去根本不存在，現在每天要做幾十次。

三是能力差距會被繼續拉大。 同樣的AI工具，會用的人和不會用的人，產出能差10倍。不是AI變強了你就自動受益，你得學會怎么"管AI工時"這件事。

過去你會寫prompt就夠了。現在還得會管token預算、會挑effort級別、會拆任務粒度、會算AI工時的投入產出比。

這其實是一套類似項目管理的新技能，但99%的AI教程還卡在"怎么寫提示詞"這個老話題上。

不過"管AI"其實分兩種玩法。

低階玩法是管token預算、挑effort級別、算賬單ROI…這些讓你不虧。

高階玩法是另一件事：把你（或者你公司里最值錢的那個專家）裝進AI里。

公司里最資深的顧問、最懂客戶的銷售、最會踩風向的投資人，他們的經驗、判斷、方法論，如果能全部沉淀成一個AI版本的"他"，整個團隊隨時調用,這才是AI作為勞動力真正的規模化價值。

不是替一個人干活，而是把一個人復制成一千個。

這件事怎么做？本周日前哨AI小課講。

AI會越來越像員工，但真正把AI用到極致的玩法，是讓它成為你和你團隊的"知識延伸"。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.