![]()
DeepSeek V4發布后,海外開發者社區里出現了一批令人不安的討論。不是關于幻覺率,也不是關于排名——而是關于賬單。
有開發者在社區反映:「用V4跑了一個Agent任務,Token消耗是V3的8倍。」這個方向上,多位開發者有類似反饋:AI從「問答」進入「自主行動」階段,Token消耗量的量級在發生變化。
量級變了,意味著什么?意味著很多公司原本的商業模式,可能需要重算一遍。
在傳統「問答式」AI場景里,一次對話的Token消耗大概在數百到數千個。用戶提問,模型回答,結束。這個量級對應的API成本是每次幾分錢到幾毛錢,相當可控。
但Agent模式完全不同。一個Agent任務,需要模型自主規劃→搜索信息→調用工具→執行步驟→驗證結果,整個流程下來Token消耗可能達到數萬甚至數十萬。這不是線性增長,是數量級的跳躍。
? DeepSeek V4 Agent任務評測:開源模型中排名第一(來源:東方財富,2026年4月27日)
? V4單次Agent任務Token消耗:據多位開發者社區反饋,實測增幅在5至10倍區間(本報道無法獨立核實,僅供參考)
? AI數據中心CPU與GPU配比演變趨勢:從當前約1:4—1:8,向Agent時代約1:1—1:2演進(來源:TrendForce,2026年4月)
? OpenClaw全面適配DeepSeek V4 Flash和Pro兩個版本(來源:東方財富,2026年4月27日)
TrendForce的數據可以從側面印證這一趨勢:AI數據中心CPU與GPU配比,正在從當前的1:4至1:8,向Agent時代的1:1至1:2演進。CPU重新變得稀缺,正是因為Agent任務對調度層的要求大幅提升。Token消耗量上漲,和CPU需求上漲,是同一件事的兩個面。
▍第一類:按「次數」收費的SaaS產品——定價模型亟需重構
這類產品過去的定價邏輯是:用戶每月付固定月費,可以「按次數」使用AI功能。這個模型在問答時代是合理的,因為單次成本可控。但進入Agent時代,一次「幫我完成這個任務」的請求,可能消耗的Token相當于過去100次問答,而向用戶收取的費用還是「一次」。利潤率將持續受壓,直到公司重新設計定價結構——比如按「任務復雜度」分級計費,或按Token消耗量直接穿透給用戶。
▍第二類:API提供商——賬單變大,但要警惕用戶關閘
對于Anthropic、DeepSeek、OpenAI等API提供商,Token消耗量上升是好消息,API收入直接與Token掛鉤。但存在一個潛在的臨界點:如果單次任務成本顯著超出用戶預期,用戶可能選擇降低調用頻率,或自建更輕量的模型做前期過濾,只把真正復雜的任務交給大模型。
▍第三類:「Token優化」賽道——一個正在形成的新機會
當Token成本成為AI應用公司的關鍵財務指標,就會有人專門做「如何用更少Token完成同等任務」的工具。這個賽道在云計算時代叫「FinOps(成本優化)」,在AI時代對應的可能是「Prompt壓縮」「Context剪枝」「任務拆解優化」等方向。這個需求從理論變成現實的速度,可能比很多人預期的更快。
國內AI應用公司大多還處于早期增長階段,用戶規模快速擴張時,Token成本往往不是第一關注點。但這個問題早晚會來:當月活用戶從10萬增長到100萬,如果每個用戶開始使用Agent功能,API成本曲線的斜率會發生質變。
在融資模型設計上,這意味著需要把「用戶增長」和「API成本增長」分開建模,而不是簡單地假設兩者線性關系。「每用戶平均Token消耗」(Token per MAU)可能會成為一個新的關鍵分析指標,幫助觀察者更清晰地評估真實成本結構。
這不是AI變貴了,這是AI開始「干活」了。
DeepSeek V4 Agent任務排名開源第一,這是能力的里程碑。但隨之而來的Token消耗問題,是商業模式的考題。能力提升是確定的,商業模式怎么跟上,是接下來12個月AI應用公司最需要回答的問題。
你用的AI,每次「干活」可能比你想象的貴10倍。 SaaS公司的問題是:這個賬,誰來付?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.