文|鄧詠儀
編輯|張雨忻
“阿里云MaaS業務的Token收入,在2026年的過去5個月里增長了15倍,月度Token收入已經達到數億元級別。”這是阿里云在5月20日的發布會上給出的最新數字。而拉動這筆收入的最直接原因指向了一個詞:Agent。
這一天,阿里云發布了新一代旗艦模型Qwen 3.7 Max等一系列產品,這距離Qwen 3.6 Max的面世僅僅過去了一個月。
為什么這么著急?隨著今年2月OpenClaw的爆火,各家模型廠商都開始針對Agent做模型在Coding能力上的提升。大模型的Coding能力之爭越來越白熱化,阿里也必須端出一款在Coding方面能打的模型,保持自身MaaS業務的競爭力。“未來是Agent Cloud的時代。”阿里云公共云總裁劉偉光表示。
無獨有偶,大洋彼岸的硅谷,Google I/O大會也在同一天舉辦,主題同樣是Agent Cloud,Google新發布的芯片、模型、應用……幾乎所有產品也都圍繞Agent展開。
Agent Coding,已經成為全球現階段的AI共識。
![]()
△圖源:阿里云
狠狠做Agent
發布會第一個端上來的新“千問云”官網,這是一個為Agent設計的網頁,也是阿里云成立17年以來,第一次為單獨業務做的獨立官網。
![]()
△圖源:千問云
“千問云是為Agent設計的,而不是人類。”阿里云公共云事業部負責人劉偉光說,這來自2024年底,阿里云內部的一個判斷:未來云計算產品的主要使用對象,也會逐漸從人類工程師變成Agent。
在過往,一個開發者或企業想要在云上部署服務,需要打開官網,注冊之后,然后面對上百個產品分類,自己選機型、配網絡、開實例、裝環境、調API——每一步都需要人類工程師做判斷,上手門檻不低。
但在千問云官網上線背后,動線會發生變化:Agent會先找模型,再找工具和skills,最后才是底層云資源。順序反過來了。
一個例子是,在龍蝦上線后,阿里云發現Agent可以在一天之內自動完成云計算資源的開通,這在過去,是人類要干兩周的活。“未來不需要人來開通了,Agent自動就在后臺把云計算資源激活了。”劉偉光說。
官網只是前菜。阿里云從上層的模型到Infra到底層的芯片,都圍繞Agent重新完成了一次適配。
首先是新一代旗艦模型Qwen 3.7 Max的推出,這距離Qwen 3.6 Max的發布僅一個月時間。
盡管一直以來阿里在開源領域建立了不錯的影響力和口碑,但相較國內的智譜GLM、Kimi,阿里的旗艦模型并沒有享受到小龍蝦帶來的最大紅利。
而Qwen 3.7 Max的發布,則阿里在Coding領域試圖扳回一城的動作。
在目前業界最權威的代碼能力測試中,Qwen 3.7 Max已經追平了DeepSeek的最強版本,在難度更高的復雜工程任務測試中,Qwen 3.7 Max也排到了第一的位置。
![]()
△Qwen3.7-Max可獨立執行長達35小時的長程復雜任務,工具調用數量也在各大模型中位于前列,圖源:阿里云
相較上一代Qwen 3.6 Max Preview,Qwen 3.7 Max最大的升級是長周期任務能力的大幅強化——Agent可以自主執行跨越數十小時、上千步驟的復雜任務,而不需要人類中途介入。
長程任務能力越強,意味著Agent能夠獨立完成的任務復雜度越高、人類介入越少。這也是Claude Code、Gemini Deep Research等當下最強Agent產品的核心競爭維度。
阿里云CTO周靖人舉的一個例子是:在平頭哥的新芯片平臺上,Qwen3.7-Max通過自主編程和超1000次工具調用,實現了平臺關鍵內核的自我進化,推理速度較原版本提升10倍。
這意味著,模型能夠像成熟的工程師一樣,獨立解決代碼中間缺陷的問題,也可以幫助工程師開發復雜的功能。
而這些任務能夠完成,也離不開芯片和Infra的適配:在芯片層,阿里云的新一代訓推一體AI芯片真武M890,以及自研互聯芯片ICN Switch 1.0,都搭載在超節點服務器上,主打的就是Agent的大規模并發場景。
而現在,阿里平頭哥PPU芯片出貨已經超過54萬片,并且在悟空、秒悟等AI應用中已經開始提供推理服務。
怎么把Token生意越做越大
Agent爆發帶來了Token消耗的爆發——Agent本質是代碼生成,一次任務調用的Token量,是普通對話場景的十倍甚至百倍。
所以,Agent共識也直接演變成了模型市場的一場明牌戰爭:誰的模型在Agent場景下被調用得多,誰就能夠迅速獲得收入——當今市場的最大贏家無疑就是Anthropic,據華爾街日報,Anthropic的營收預計將在第二季度增長一倍以上,達到109億美元。
![]()
△圖源:華爾街日報
阿里云也受益于此。2025年,阿里云自然年全年營收超1466億元,當年營收增速28.6%,后者主要得益于AI產品的貢獻。
阿里巴巴CEO吳泳銘在上周的財報電話會上透露,6月份季度,包含百煉MaaS平臺在內的AI模型與應用服務年化經常性收入(ARR)將突破100億元,年底突破300億元。
不過,在這場Token戰爭中,阿里和字節選擇了兩種不一樣的打法。
“Token帶來的收入主要來自兩端,一端是以Coding為代表的大語言模型,另一端是視頻模型。但在過去一段時間,很多人會把兩個市場的Token增量混為一談,這是不合適的。”劉偉光強調。
字節占住了視頻模型市場——有研究機構測算,Seedance 2.0爆火后,字節在視頻模型市場的Token日均消耗已占整個市場的80%。2025年底火山曾立下目標——2026年MaaS服務收入超過100億,但在Seedance 2.0爆火之后,這個目標已經再度上調。
相較之下,阿里云則在大語言模型上占據優勢。“有開發者的公司,才會需要云,所以阿里云的存量客戶(肯定有開發者)幾乎都是Coding的潛在用戶。”劉偉光說。
2025年底,阿里云曾喊出“2026拿下AI云市場增量的80%”的業務目標。阿里云將當下的業務火力,集中在了Coding領域。“今年前5個月,我們可以說,阿里云已經拿到了LLM模型市場增量的80%。”
為了配合這一目標,阿里云對銷售的考核方式也在變——不是看誰賣出去的Token量最大,而是比誰賣出去的Token最值錢。
簡單來說,阿里云現在追求的,并不是簡單聊天產生的Token消耗,因為這類模型的價格已經到了地板價。
相反,阿里云如今的一個核心指標是:模型接入客戶的核心業務系統數量。這意味著,阿里云希望賣出去的Token,是被客戶用來寫代碼、做決策、跑流程。而一旦進入企業的核心生產流程,Token消耗量是指數級上升的,單價更高,復購更穩定,對應的也是更高質量的收入。
這源于Coding的Token消耗邏輯和視頻并不一樣。視頻模型的Token消耗是一次性的——生成一段視頻,任務結束。
代碼場景則更像一個自我進化的過程:模型寫出代碼,代碼變成應用,應用部署到云上,應用運行起來后又需要調用模型,模型再生成更多代碼。
如今的大模型競賽,已經完全是一種系統工程的較量——芯片、Infra與大模型的耦合,已經成為影響模型訓練、提供推理服務系效率的最重要因素;商業競爭也在加速,則是迅速驗證場景價值,為模型反哺智能。
“芯片、模型和云,現在三者就像是齒輪要和在一起、螺旋上升的過程。”劉偉光表示,如果未來拼的是每一塊芯片都能跑出比競爭對手更多的Token、更高質量的Token,“那我們就勝利了。”
以下為劉偉光關于阿里云、Agent趨勢Token之戰的更多分享,經《智能涌現》編輯整理:
1、云計算的天花板因為Agent再度被打開了
云計算時代,我們的商業模式相對簡單,但有一個長期痛點:盤點客戶IT預算時,企業內部的軟件開發和人力外包這塊,我們是吃不到的。現在正好反過來,這些預算恰恰是AI Coding能100%命中的。
我們看到,互聯網企業的Token支出已經達到IT支出的15%~20%,傳統企業還在5%以下,空間還很大。阿里云今年的目標,是在每一個客戶的收入中,Token收入占比不低于20%。
以汽車行業為例,過去我們能做的就是ERP上云,后來是智駕算力,再后來是大模型對話,現在連廣告營銷都能做了。原來汽車行業最大IT投入在ERP,現在變成AI。
金融領域也一樣,以前做券商客戶,我們很難跟客戶談業務,那是專業領域。現在是客戶主動找我們,因為頭部投研、量化、私募的業務場景,都必須跟大模型深度結合。
Agent已經成為帶動模型市場、甚至帶動存量云市場的最大推動力。所以Token和云這兩件事,在阿里云這里是天然綁定的。這也是為什么Coding是我們最重要的方向,它幾乎for everything。
2、Agent天然是云業務的增長飛輪
Token和GPU是有換算比例的。我們從實際數據發現,Agent爆發后,一張GPU卡的消費基本上帶動了一張CPU卡的消費,假如100塊錢的GPU推理消耗,會同時產生200塊錢的GPU+CPU云資源消耗——因為Agent生成的應用要部署、要運行、要彈性擴容。
這意味,廠商沒有強大的CPU云,就沒法服務這些Agent。這就是為什么我們一直在說Agent Cloud這個概念,這中間是存在真實的收入閉環的。
3、阿里云的銷售體系需要迅速變革
我們現在單獨給大客戶配純MaaS銷售,和原來賣IaaS的銷售打配合。哪怕一個客戶身上出現兩三個銷售重疊,這個代價也可以接受,最重要的是不能讓機會錯失。
坦白講,在云這個產業經營太久,每個人都有思維慣性。過去做云,版圖是很清晰的——客戶線下多少臺服務器,搬上來要花多少錢,答案不會差太大。但做MaaS,你進去之后可能發現答案遠超想象。而且MaaS需要跟業務部門、跟CEO打交道,不是跟IT人員打交道,這本身就是挑戰。
有意思的是,越傳統的企業越容易擁抱AI,因為AI讓他們一些工作變簡單了。現在,做畜牧的企業,都在大規模擁抱AI,這在過去是不可想象的。
4、Token之戰要追求數量,更要追求質量
調用量可以靠對話堆出來,但我們不看這個,我們看三個指標:付費Token客戶數是不是每天在增長;每個客戶是不是在核心系統接入模型、解決剛需;Agent自主完成任務閉環的效率。美國那邊的共識也一樣——用最少Token完成最有效任務,而不是用更多Token完成更多任務。
正因為追求高質量Token,MaaS從第一天起就應該是有利潤的生意。現在,我們的百煉平臺(Infra)和模型團隊本身就在一起,每天做推理框架的極致優化。
中國目前還是按量為主,但我們的終極目標一定是希望讓客戶為結果付費。
封面來源|AI生成
歡迎交流
本文來自微信公眾號“智能涌現”,作者:鄧詠儀,36氪經授權發布。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.