網易首頁 > 網易號 > 正文申請入駐

5個月MaaS收入增長15倍，阿里云找到了做大Token生意的辦法

2026-05-22 12:22:35　來源: 36氪

北京舉報

分享至

文｜鄧詠儀

編輯｜張雨忻

“阿里云MaaS業務的Token收入，在2026年的過去5個月里增長了15倍，月度Token收入已經達到數億元級別。”這是阿里云在5月20日的發布會上給出的最新數字。而拉動這筆收入的最直接原因指向了一個詞：Agent。

這一天，阿里云發布了新一代旗艦模型Qwen 3.7 Max等一系列產品，這距離Qwen 3.6 Max的面世僅僅過去了一個月。

為什么這么著急？隨著今年2月OpenClaw的爆火，各家模型廠商都開始針對Agent做模型在Coding能力上的提升。大模型的Coding能力之爭越來越白熱化，阿里也必須端出一款在Coding方面能打的模型，保持自身MaaS業務的競爭力。“未來是Agent Cloud的時代。”阿里云公共云總裁劉偉光表示。

無獨有偶，大洋彼岸的硅谷，Google I/O大會也在同一天舉辦，主題同樣是Agent Cloud，Google新發布的芯片、模型、應用……幾乎所有產品也都圍繞Agent展開。

Agent Coding，已經成為全球現階段的AI共識。

△圖源：阿里云

狠狠做Agent

發布會第一個端上來的新“千問云”官網，這是一個為Agent設計的網頁，也是阿里云成立17年以來，第一次為單獨業務做的獨立官網。

△圖源：千問云

“千問云是為Agent設計的，而不是人類。”阿里云公共云事業部負責人劉偉光說，這來自2024年底，阿里云內部的一個判斷：未來云計算產品的主要使用對象，也會逐漸從人類工程師變成Agent。

在過往，一個開發者或企業想要在云上部署服務，需要打開官網，注冊之后，然后面對上百個產品分類，自己選機型、配網絡、開實例、裝環境、調API——每一步都需要人類工程師做判斷，上手門檻不低。

但在千問云官網上線背后，動線會發生變化：Agent會先找模型，再找工具和skills，最后才是底層云資源。順序反過來了。

一個例子是，在龍蝦上線后，阿里云發現Agent可以在一天之內自動完成云計算資源的開通，這在過去，是人類要干兩周的活。“未來不需要人來開通了，Agent自動就在后臺把云計算資源激活了。”劉偉光說。

官網只是前菜。阿里云從上層的模型到Infra到底層的芯片，都圍繞Agent重新完成了一次適配。

首先是新一代旗艦模型Qwen 3.7 Max的推出，這距離Qwen 3.6 Max的發布僅一個月時間。

盡管一直以來阿里在開源領域建立了不錯的影響力和口碑，但相較國內的智譜GLM、Kimi，阿里的旗艦模型并沒有享受到小龍蝦帶來的最大紅利。

而Qwen 3.7 Max的發布，則阿里在Coding領域試圖扳回一城的動作。

在目前業界最權威的代碼能力測試中，Qwen 3.7 Max已經追平了DeepSeek的最強版本，在難度更高的復雜工程任務測試中，Qwen 3.7 Max也排到了第一的位置。

△Qwen3.7-Max可獨立執行長達35小時的長程復雜任務，工具調用數量也在各大模型中位于前列，圖源：阿里云

相較上一代Qwen 3.6 Max Preview，Qwen 3.7 Max最大的升級是長周期任務能力的大幅強化——Agent可以自主執行跨越數十小時、上千步驟的復雜任務，而不需要人類中途介入。

長程任務能力越強，意味著Agent能夠獨立完成的任務復雜度越高、人類介入越少。這也是Claude Code、Gemini Deep Research等當下最強Agent產品的核心競爭維度。

阿里云CTO周靖人舉的一個例子是：在平頭哥的新芯片平臺上，Qwen3.7-Max通過自主編程和超1000次工具調用，實現了平臺關鍵內核的自我進化，推理速度較原版本提升10倍。

這意味著，模型能夠像成熟的工程師一樣，獨立解決代碼中間缺陷的問題，也可以幫助工程師開發復雜的功能。

而這些任務能夠完成，也離不開芯片和Infra的適配：在芯片層，阿里云的新一代訓推一體AI芯片真武M890，以及自研互聯芯片ICN Switch 1.0，都搭載在超節點服務器上，主打的就是Agent的大規模并發場景。

而現在，阿里平頭哥PPU芯片出貨已經超過54萬片，并且在悟空、秒悟等AI應用中已經開始提供推理服務。

怎么把Token生意越做越大

Agent爆發帶來了Token消耗的爆發——Agent本質是代碼生成，一次任務調用的Token量，是普通對話場景的十倍甚至百倍。

所以，Agent共識也直接演變成了模型市場的一場明牌戰爭：誰的模型在Agent場景下被調用得多，誰就能夠迅速獲得收入——當今市場的最大贏家無疑就是Anthropic，據華爾街日報，Anthropic的營收預計將在第二季度增長一倍以上，達到109億美元。

△圖源：華爾街日報

阿里云也受益于此。2025年，阿里云自然年全年營收超1466億元，當年營收增速28.6%，后者主要得益于AI產品的貢獻。

阿里巴巴CEO吳泳銘在上周的財報電話會上透露，6月份季度，包含百煉MaaS平臺在內的AI模型與應用服務年化經常性收入（ARR）將突破100億元，年底突破300億元。

不過，在這場Token戰爭中，阿里和字節選擇了兩種不一樣的打法。

“Token帶來的收入主要來自兩端，一端是以Coding為代表的大語言模型，另一端是視頻模型。但在過去一段時間，很多人會把兩個市場的Token增量混為一談，這是不合適的。”劉偉光強調。

字節占住了視頻模型市場——有研究機構測算，Seedance 2.0爆火后，字節在視頻模型市場的Token日均消耗已占整個市場的80%。2025年底火山曾立下目標——2026年MaaS服務收入超過100億，但在Seedance 2.0爆火之后，這個目標已經再度上調。

相較之下，阿里云則在大語言模型上占據優勢。“有開發者的公司，才會需要云，所以阿里云的存量客戶（肯定有開發者）幾乎都是Coding的潛在用戶。”劉偉光說。

2025年底，阿里云曾喊出“2026拿下AI云市場增量的80%”的業務目標。阿里云將當下的業務火力，集中在了Coding領域。“今年前5個月，我們可以說，阿里云已經拿到了LLM模型市場增量的80%。”

為了配合這一目標，阿里云對銷售的考核方式也在變——不是看誰賣出去的Token量最大，而是比誰賣出去的Token最值錢。

簡單來說，阿里云現在追求的，并不是簡單聊天產生的Token消耗，因為這類模型的價格已經到了地板價。

相反，阿里云如今的一個核心指標是：模型接入客戶的核心業務系統數量。這意味著，阿里云希望賣出去的Token，是被客戶用來寫代碼、做決策、跑流程。而一旦進入企業的核心生產流程，Token消耗量是指數級上升的，單價更高，復購更穩定，對應的也是更高質量的收入。

這源于Coding的Token消耗邏輯和視頻并不一樣。視頻模型的Token消耗是一次性的——生成一段視頻，任務結束。

代碼場景則更像一個自我進化的過程：模型寫出代碼，代碼變成應用，應用部署到云上，應用運行起來后又需要調用模型，模型再生成更多代碼。

如今的大模型競賽，已經完全是一種系統工程的較量——芯片、Infra與大模型的耦合，已經成為影響模型訓練、提供推理服務系效率的最重要因素；商業競爭也在加速，則是迅速驗證場景價值，為模型反哺智能。

“芯片、模型和云，現在三者就像是齒輪要和在一起、螺旋上升的過程。”劉偉光表示，如果未來拼的是每一塊芯片都能跑出比競爭對手更多的Token、更高質量的Token，“那我們就勝利了。”

以下為劉偉光關于阿里云、Agent趨勢Token之戰的更多分享，經《智能涌現》編輯整理：

1、云計算的天花板因為Agent再度被打開了

云計算時代，我們的商業模式相對簡單，但有一個長期痛點：盤點客戶IT預算時，企業內部的軟件開發和人力外包這塊，我們是吃不到的。現在正好反過來，這些預算恰恰是AI Coding能100%命中的。

我們看到，互聯網企業的Token支出已經達到IT支出的15%~20%，傳統企業還在5%以下，空間還很大。阿里云今年的目標，是在每一個客戶的收入中，Token收入占比不低于20%。

以汽車行業為例，過去我們能做的就是ERP上云，后來是智駕算力，再后來是大模型對話，現在連廣告營銷都能做了。原來汽車行業最大IT投入在ERP，現在變成AI。

金融領域也一樣，以前做券商客戶，我們很難跟客戶談業務，那是專業領域。現在是客戶主動找我們，因為頭部投研、量化、私募的業務場景，都必須跟大模型深度結合。

Agent已經成為帶動模型市場、甚至帶動存量云市場的最大推動力。所以Token和云這兩件事，在阿里云這里是天然綁定的。這也是為什么Coding是我們最重要的方向，它幾乎for everything。

2、Agent天然是云業務的增長飛輪

Token和GPU是有換算比例的。我們從實際數據發現，Agent爆發后，一張GPU卡的消費基本上帶動了一張CPU卡的消費，假如100塊錢的GPU推理消耗，會同時產生200塊錢的GPU+CPU云資源消耗——因為Agent生成的應用要部署、要運行、要彈性擴容。

這意味，廠商沒有強大的CPU云，就沒法服務這些Agent。這就是為什么我們一直在說Agent Cloud這個概念，這中間是存在真實的收入閉環的。

3、阿里云的銷售體系需要迅速變革

我們現在單獨給大客戶配純MaaS銷售，和原來賣IaaS的銷售打配合。哪怕一個客戶身上出現兩三個銷售重疊，這個代價也可以接受，最重要的是不能讓機會錯失。

坦白講，在云這個產業經營太久，每個人都有思維慣性。過去做云，版圖是很清晰的——客戶線下多少臺服務器，搬上來要花多少錢，答案不會差太大。但做MaaS，你進去之后可能發現答案遠超想象。而且MaaS需要跟業務部門、跟CEO打交道，不是跟IT人員打交道，這本身就是挑戰。

有意思的是，越傳統的企業越容易擁抱AI，因為AI讓他們一些工作變簡單了。現在，做畜牧的企業，都在大規模擁抱AI，這在過去是不可想象的。

4、Token之戰要追求數量，更要追求質量

調用量可以靠對話堆出來，但我們不看這個，我們看三個指標：付費Token客戶數是不是每天在增長；每個客戶是不是在核心系統接入模型、解決剛需；Agent自主完成任務閉環的效率。美國那邊的共識也一樣——用最少Token完成最有效任務，而不是用更多Token完成更多任務。

正因為追求高質量Token，MaaS從第一天起就應該是有利潤的生意。現在，我們的百煉平臺（Infra）和模型團隊本身就在一起，每天做推理框架的極致優化。

中國目前還是按量為主，但我們的終極目標一定是希望讓客戶為結果付費。

封面來源｜AI生成

歡迎交流

本文來自微信公眾號“智能涌現”，作者：鄧詠儀，36氪經授權發布。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.