![]()
智東西
作者 李水青
編輯 漠影
2026阿里云峰會,可能是阿里云成立17年來釋放信號最為密集的一場發布會。
智東西5月20日杭州報道,今天,阿里云宣布完成“芯片-云-模型-推理”全棧Agent化升級,同步推出搭載自研AI芯片真武M890的超節點服務器、最新旗艦模型Qwen3.7-Max、全新AI產品“千問云”等超50項新品及升級。這是國內云廠商首次圍繞Agent進行全棧產品發布。
“Agent突破臨界點之后,可以24小時不間斷工作,對AI和云的需求無窮無盡。”阿里云資深副總裁劉偉光說,“阿里云正在進行全棧技術革新,從底層芯片、Agentic Cloud、模型到推理平臺全面升級,建設中國最大的AI工廠。”
![]()
放眼全球,云巨頭們正在展開一場全棧AI競賽。谷歌有TPU+Gemini+GCP,亞馬遜有Trainium+Nova+AWS,而阿里云此次亮出的“芯-云-模型-推理”全棧體系被業內稱為阿里“通云哥”:通義+阿里云+平頭哥。主要發布內容如下:
1. 平頭哥首發新一代訓推一體AI芯片真武M890,性能為上一代3倍,并公布未來兩年路線圖;磐久AL128超節點服務器實現128卡互聯,P2P時延低于150ns。
![]()
2. 阿里云全面邁入Agentic Cloud,發布了至少32項Agentic Cloud新品及更新,覆蓋運行時、編排、治理、安全、記憶、數據平面六大能力;對云產品進行Skill化、MCP化和CLI化改造,讓Agent像調函數一樣調用云能力。
3.Qwen3.7-Max正式發布,模型登頂Arena國產第一,可在全新芯片上自主工作35小時,將內核性能提升10倍。(智東西實測→《阿里Qwen3.7競技場殺至國產第一!一手實測:分分鐘破解奧賽難題,圖文視覺全都難不倒》)
4.百煉平臺開放并池調度、上下文緩存等彈性技術,接入智譜、MiniMax、Kimi等150多款模型。
5.千問云官網(www.qianwenai.com)上線,以一行指令替代傳統導航,全面Skill/CLI化,對Agent更友好。
一、李飛飛首秀:連發32大新品及更新
這是阿里云首席技術官李飛飛自4月8日就任后在峰會上的重要首秀。
李飛飛宣布,阿里云通過Agent Infrastructure為Agent負載提供支持,并推出Agentic Products——面向Agent的云產品。
![]()
Agentic時代,云業務面臨短生命周期、數據模態與存儲形式復雜、無規律突發負載、動態環境依賴、任務級安全管控和大規模動態編排六大挑戰,而Agent Infrastructure以運行時、編排、治理、安全、記憶、數據平面六大能力來應對挑戰:
![]()
具體到運行環境,阿里云為Agent構建了完整的支撐體系:輕量高效的沙箱執行環境、多Agent協同能力、跨任務的記憶能力、順暢的數據流轉通路,以及全域智能運維能力。
Agentic Cloud運行時五大新品及更新如下:
![]()
Agentic Cloud編排一大新品及更新如下:
![]()
Agentic Cloud治理四大新品及更新如下:
![]()
Agentic Cloud安全五大新品及更新如下:
![]()
Agentic Cloud記憶七大新品及更新如下:
![]()
Agentic Cloud數據平面十大新品及更新:
![]()
阿里云Agent Infrastructure已助MiniMax企業級Agent大規模落地。
![]()
有了這些產品及更新,未來一個開發者只需要給Agent一句自然語言指令,Agent就能自動完成從資源識別到應用部署的全流程,無需人工點擊控制臺或編寫復雜腳本。
李飛飛認為,傳統云產品的交互邏輯是為人設計的,用戶看著控制臺點擊按鈕,或者通過API編寫代碼調用。但Agent的工作負載是“無規律彈性、短生命周期、瞬時起量即走”,與傳統云計算的穩態負載截然不同。
![]()
傳統云產品打開控制臺,看到一堆菜單、配置項、儀表盤,這些視覺化信息對人很友好,但對Agent毫無意義。為此,阿里云對云產品進行了Skill化、MCP化和CLI化改造,讓每一個云產品都變成Agent可以“像調函數一樣調用”的標準化能力模塊。
![]()
阿里云不是在云上加一層Agent接口,而是把云本身變成Agent能用的東西。這套改造的野心在于讓云從“人的工具”變成“Agent的操作系統”。
![]()
二、平頭哥首發真武M890,扔出128卡超節點算力王炸
芯片層,阿里云亮出了一張目前國內云廠商中獨一份的王牌:覆蓋算力、網絡、存儲的完整自研數據中心芯片矩陣。
峰會現場,平頭哥新一代訓推一體AI芯片真武M890首次亮相。規格相當硬核:144GB顯存,片間互聯帶寬800GB/s,性能是上一代真武810E的3倍。芯片原生支持FP32到FP4等多種數據精度,可應用于高精度訓練到超低精度推理的全場景。在低精度推理場景下,不僅能保證模型輸出質量,還能顯著降低單次推理的算力開銷。
![]()
更值得關注的是基于真武M890的磐久AL128超節點服務器,搭載自研互聯芯片ICN Switch 1.0。這個超節點可讓128張AI芯片組成一臺計算機,P2P時延低于150ns,單柜帶寬達到Pb/s級。
![]()
為什么要做這么大的超節點?因為Agentic時代,算力集群需要承載成千上萬個Agent同時運行,每個Agent在一次任務中可能連續發起數十次模型調用,對通信時延和帶寬的要求是指數級上升的。該超節點已上線阿里云百煉,支持Qwen、DeepSeek、Kimi等主流模型。
![]()
平頭哥還首次公布了真武系列芯片的路線規劃:未來兩年將陸續推出算力更強的真武V900、真武J900兩代芯片。目前真武系列AI芯片累計出貨56萬片,已服務中國電信、中國一汽、浦發銀行等20多個行業的400多家客戶。
![]()
加上自研的倚天系列CPU、磐脈智能網卡、鎮岳存儲主控芯片、ICN Switch互聯芯片,平頭哥的芯片版圖已經從“單點突破”走到了“全面覆蓋”。
三、Qwen3.7-Max來了,登頂Arena榜,勝任35小時長程任務
Qwen3.7-Max是阿里巴巴最新發布的旗艦大模型。
![]()
在三方機構Arena全球大模型盲測總榜中,它超過Kimi-K2.6、DeepSeek-V4-Pro、GLM-5.1,與GPT、Claude、Gemini最強模型接近,位列國產模型第一。在細分榜單上,數學排名第7、專家任務第9、編程任務第10,表現相當均衡。
![]()
比跑分更有說服力的,是一個堪稱“極限測試”的實戰案例。在模型訓練時從未接觸過的全新硬件平臺——平頭哥真武M890芯片上,Qwen3.7-Max僅憑一份任務說明,從零開始自主工作35小時,獨立進行了432次內核評估、1158次工具調用,完全自主地完成了編寫、編譯、性能分析與迭代改進的全流程。最終,它優化后的推理內核比SGLang Triton官方參考實現快了10倍。
![]()
沒有人類干預,沒有中間指導,35小時,從零到生產級。測試軌跡還顯示,模型在獨立運行超過30小時后仍發現了有效優化點,甚至主動發起了一次關鍵的架構重設計。這個案例展示的不是模型“回答問題”的能力,而是模型“自主完成復雜工程任務”的能力——這恰恰是Agent場景最核心的需求。
![]()
阿里巴巴通義大模型事業部負責人周靖人談道:“大模型正在經歷一次核心范式轉移——從對齊人類偏好,到對齊任務目標。過去我們追求的是模型‘說得好’,現在要求模型‘做得到’。Qwen3.7-Max的設計初衷,就是讓模型真正成為Agent的智能內核,具備自主規劃、持續迭代、跨工具協作的能力。”
![]()
值得注意的是,近3個月內,千問旗艦模型已經連續迭代了3.5、3.6、3.7三個版本,保持著極高的發布節奏。阿里巴巴顯然在刻意加速模型進化,以匹配Agent時代對模型能力的指數級增長需求。
四、百煉平臺全面開放,智譜、Minimax、Kimi等頂尖模型首批上架
如果說芯片是地基、模型是引擎,那百煉推理平臺就是Agent真正跑起來的“生產車間”。
阿里云在百煉平臺上構建了大規模GPU資源集群,并通過一套完整的技術棧應對Agent場景的特殊挑戰:并池調度將GPU資源統一調度提升利用率;上下文緩存消除多輪對話和長鏈路任務中的重復計算開銷;吞吐彈性調度應對并發請求的波峰波谷;Agentic RL基于實際執行反饋讓模型持續迭代。此外,百煉內建了安全治理能力——在Agent自主運行的語境下,一個24小時不間斷執行任務的Agent如果沒有邊界約束,后果不可控。百煉的安全機制確保Agent始終在預設的權限范圍內行動。
![]()
在生態策略上,百煉保持開放接入。峰會當天,阿里云宣布與月之暗面、Minimax、智譜、階躍星辰、愛詩科技、生數科技等達成合作,GLM-5.1、MiniMax M2.7、Kimi K2.6、Pixverse-v6-it2v、Kling-v3-omni-video-generation、Vidu Q3-Pro等模型已上架百煉,并通過千問云官網全面售賣。目前百煉已提供150多款主流模型API。
百煉不僅提供阿里自研模型服務,同時面向頭部AI廠商開放,為用戶提供“一個入口、多模型可選”的一站式服務體驗。目前百煉已推出按需、按時長的靈活計費模式,用戶可通過統一SDK接口接入不同模型,實現靈活切換與高效迭代。據阿里最新財報,截至2026年3月,百煉平臺該季度客戶數量同比增長了8倍。
五、首發千問云,全面Skill和CLI化,對Agent更友好
千問云是阿里云成立17年來,首次在阿里云官網之外推出的全新產品官網。打開頁面,突出的不是產品列表,也不是控制臺,沒有任何傳統意義上的導航結構。首頁只有一行字:
安裝 Skills npx skills add QianWen-AI/qianwen-ai
這是一條Agent可讀的prompt指令。阿里云將所有模型服務的核心能力封裝為標準化的Skills和CLI工具,智能體可以直接解析這條指令,“學會”網站的全部能力,并根據需求自主調用。
![]()
過去十年,云的交互邏輯是“人登錄控制臺→選產品→配參數→調API”。這套流程對人類來說已經足夠順暢,但對Agent來說完全不可用。Agent不看網頁,不點按鈕,它需要的是結構化的能力描述、明確的調用協議和可預期的反饋機制。
千問云Skills將模型選型、調用、認證配置、用量查詢等完整鏈路能力封裝,用戶無需編寫任何代碼,Agent即可動態路由不同模型——自動用視覺模型處理圖片,用生圖模型生成圖片,用視頻生成模型創作視頻。千問云CLI則可覆蓋登錄認證、模型查詢、調用、用量查詢和環境診斷等能力,直接通過腳本或命令行自動化完成所有模型服務的工作流。
基于千問云Skills和CLI,Agent還能實時拉取模型用量數據,自動分析趨勢、識別異常,為用戶提供成本優化建議。目前,千問云Skills和CLI均已在GitHub開源。付費模式上,千問云提供按量付費和Token Plan訂閱兩種模式,后者適用于高頻AI編程和Agent場景,可顯著降低Token成本。
結語:全球云巨頭展開AI全棧競賽
當云的主要消費者從人變成Agent,所有圍繞人類設計的界面、流程和交互邏輯,都將被重寫。
從芯片真武M890,到Agentic Cloud,到Qwen3.7-Max,到百煉平臺,再到千問云……阿里云在2026年5月20日這一天,完成了一次從底層到入口的全鏈路重構。
放眼全球,這場競賽剛剛進入深水區。谷歌以TPU+Gemini+GCP構筑閉環,亞馬遜以Trainium+Nova+AWS正面迎戰,微軟手握Maia+ Copilot+Azure。而阿里云此次亮出的“芯-云-模型-推理”全棧體系,證明了中國云廠商有能力在同一張牌桌上競爭。
吳泳銘在財報電話會上把AI投入比作建設“訓練工廠”和“推理工廠”。今天,這兩座工廠已經開始全速運轉。未來三年,阿里云的AI算力規模將比2022年增長十倍,是已經在執行的計劃。
值得一提的是,阿里云選擇了“開放”作為差異化路徑——百煉平臺接入150多款模型,千問云Skills和CLI全部開源,這既是生態策略,也是對Agent時代“沒有一家模型能通吃一切”這一底層判斷的回應。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.