網易首頁 > 網易號 > 正文申請入駐

阿里李飛飛首秀：一口氣面向Agent發了32個新品

任敏一口氣發了154張照片

2026-05-21 10:05:06　來源: 智東西

北京舉報

分享至

智東西
作者李水青
編輯漠影

2026阿里云峰會，可能是阿里云成立17年來釋放信號最為密集的一場發布會。

智東西5月20日杭州報道，今天，阿里云宣布完成“芯片-云-模型-推理”全棧Agent化升級，同步推出搭載自研AI芯片真武M890的超節點服務器、最新旗艦模型Qwen3.7-Max、全新AI產品“千問云”等超50項新品及升級。這是國內云廠商首次圍繞Agent進行全棧產品發布。

“Agent突破臨界點之后，可以24小時不間斷工作，對AI和云的需求無窮無盡。”阿里云資深副總裁劉偉光說，“阿里云正在進行全棧技術革新，從底層芯片、Agentic Cloud、模型到推理平臺全面升級，建設中國最大的AI工廠。”

放眼全球，云巨頭們正在展開一場全棧AI競賽。谷歌有TPU+Gemini+GCP，亞馬遜有Trainium+Nova+AWS，而阿里云此次亮出的“芯-云-模型-推理”全棧體系被業內稱為阿里“通云哥”：通義+阿里云+平頭哥。主要發布內容如下：

1. 平頭哥首發新一代訓推一體AI芯片真武M890，性能為上一代3倍，并公布未來兩年路線圖；磐久AL128超節點服務器實現128卡互聯，P2P時延低于150ns。

2. 阿里云全面邁入Agentic Cloud，發布了至少32項Agentic Cloud新品及更新，覆蓋運行時、編排、治理、安全、記憶、數據平面六大能力；對云產品進行Skill化、MCP化和CLI化改造，讓Agent像調函數一樣調用云能力。

3.Qwen3.7-Max正式發布，模型登頂Arena國產第一，可在全新芯片上自主工作35小時，將內核性能提升10倍。（智東西實測→《阿里Qwen3.7競技場殺至國產第一！一手實測：分分鐘破解奧賽難題，圖文視覺全都難不倒》）

4.百煉平臺開放并池調度、上下文緩存等彈性技術，接入智譜、MiniMax、Kimi等150多款模型。

5.千問云官網（www.qianwenai.com）上線，以一行指令替代傳統導航，全面Skill/CLI化，對Agent更友好。

一、李飛飛首秀：連發32大新品及更新

這是阿里云首席技術官李飛飛自4月8日就任后在峰會上的重要首秀。

李飛飛宣布，阿里云通過Agent Infrastructure為Agent負載提供支持，并推出Agentic Products——面向Agent的云產品。

Agentic時代，云業務面臨短生命周期、數據模態與存儲形式復雜、無規律突發負載、動態環境依賴、任務級安全管控和大規模動態編排六大挑戰，而Agent Infrastructure以運行時、編排、治理、安全、記憶、數據平面六大能力來應對挑戰：

具體到運行環境，阿里云為Agent構建了完整的支撐體系：輕量高效的沙箱執行環境、多Agent協同能力、跨任務的記憶能力、順暢的數據流轉通路，以及全域智能運維能力。

Agentic Cloud運行時五大新品及更新如下：

Agentic Cloud編排一大新品及更新如下：

Agentic Cloud治理四大新品及更新如下：

Agentic Cloud安全五大新品及更新如下：

Agentic Cloud記憶七大新品及更新如下：

Agentic Cloud數據平面十大新品及更新：

阿里云Agent Infrastructure已助MiniMax企業級Agent大規模落地。

有了這些產品及更新，未來一個開發者只需要給Agent一句自然語言指令，Agent就能自動完成從資源識別到應用部署的全流程，無需人工點擊控制臺或編寫復雜腳本。

李飛飛認為，傳統云產品的交互邏輯是為人設計的，用戶看著控制臺點擊按鈕，或者通過API編寫代碼調用。但Agent的工作負載是“無規律彈性、短生命周期、瞬時起量即走”，與傳統云計算的穩態負載截然不同。

傳統云產品打開控制臺，看到一堆菜單、配置項、儀表盤，這些視覺化信息對人很友好，但對Agent毫無意義。為此，阿里云對云產品進行了Skill化、MCP化和CLI化改造，讓每一個云產品都變成Agent可以“像調函數一樣調用”的標準化能力模塊。

阿里云不是在云上加一層Agent接口，而是把云本身變成Agent能用的東西。這套改造的野心在于讓云從“人的工具”變成“Agent的操作系統”。

二、平頭哥首發真武M890，扔出128卡超節點算力王炸

芯片層，阿里云亮出了一張目前國內云廠商中獨一份的王牌：覆蓋算力、網絡、存儲的完整自研數據中心芯片矩陣。

峰會現場，平頭哥新一代訓推一體AI芯片真武M890首次亮相。規格相當硬核：144GB顯存，片間互聯帶寬800GB/s，性能是上一代真武810E的3倍。芯片原生支持FP32到FP4等多種數據精度，可應用于高精度訓練到超低精度推理的全場景。在低精度推理場景下，不僅能保證模型輸出質量，還能顯著降低單次推理的算力開銷。

更值得關注的是基于真武M890的磐久AL128超節點服務器，搭載自研互聯芯片ICN Switch 1.0。這個超節點可讓128張AI芯片組成一臺計算機，P2P時延低于150ns，單柜帶寬達到Pb/s級。

為什么要做這么大的超節點？因為Agentic時代，算力集群需要承載成千上萬個Agent同時運行，每個Agent在一次任務中可能連續發起數十次模型調用，對通信時延和帶寬的要求是指數級上升的。該超節點已上線阿里云百煉，支持Qwen、DeepSeek、Kimi等主流模型。

平頭哥還首次公布了真武系列芯片的路線規劃：未來兩年將陸續推出算力更強的真武V900、真武J900兩代芯片。目前真武系列AI芯片累計出貨56萬片，已服務中國電信、中國一汽、浦發銀行等20多個行業的400多家客戶。

加上自研的倚天系列CPU、磐脈智能網卡、鎮岳存儲主控芯片、ICN Switch互聯芯片，平頭哥的芯片版圖已經從“單點突破”走到了“全面覆蓋”。

三、Qwen3.7-Max來了，登頂Arena榜，勝任35小時長程任務

Qwen3.7-Max是阿里巴巴最新發布的旗艦大模型。

在三方機構Arena全球大模型盲測總榜中，它超過Kimi-K2.6、DeepSeek-V4-Pro、GLM-5.1，與GPT、Claude、Gemini最強模型接近，位列國產模型第一。在細分榜單上，數學排名第7、專家任務第9、編程任務第10，表現相當均衡。

比跑分更有說服力的，是一個堪稱“極限測試”的實戰案例。在模型訓練時從未接觸過的全新硬件平臺——平頭哥真武M890芯片上，Qwen3.7-Max僅憑一份任務說明，從零開始自主工作35小時，獨立進行了432次內核評估、1158次工具調用，完全自主地完成了編寫、編譯、性能分析與迭代改進的全流程。最終，它優化后的推理內核比SGLang Triton官方參考實現快了10倍。

沒有人類干預，沒有中間指導，35小時，從零到生產級。測試軌跡還顯示，模型在獨立運行超過30小時后仍發現了有效優化點，甚至主動發起了一次關鍵的架構重設計。這個案例展示的不是模型“回答問題”的能力，而是模型“自主完成復雜工程任務”的能力——這恰恰是Agent場景最核心的需求。

阿里巴巴通義大模型事業部負責人周靖人談道：“大模型正在經歷一次核心范式轉移——從對齊人類偏好，到對齊任務目標。過去我們追求的是模型‘說得好’，現在要求模型‘做得到’。Qwen3.7-Max的設計初衷，就是讓模型真正成為Agent的智能內核，具備自主規劃、持續迭代、跨工具協作的能力。”

值得注意的是，近3個月內，千問旗艦模型已經連續迭代了3.5、3.6、3.7三個版本，保持著極高的發布節奏。阿里巴巴顯然在刻意加速模型進化，以匹配Agent時代對模型能力的指數級增長需求。

四、百煉平臺全面開放，智譜、Minimax、Kimi等頂尖模型首批上架

如果說芯片是地基、模型是引擎，那百煉推理平臺就是Agent真正跑起來的“生產車間”。

阿里云在百煉平臺上構建了大規模GPU資源集群，并通過一套完整的技術棧應對Agent場景的特殊挑戰：并池調度將GPU資源統一調度提升利用率；上下文緩存消除多輪對話和長鏈路任務中的重復計算開銷；吞吐彈性調度應對并發請求的波峰波谷；Agentic RL基于實際執行反饋讓模型持續迭代。此外，百煉內建了安全治理能力——在Agent自主運行的語境下，一個24小時不間斷執行任務的Agent如果沒有邊界約束，后果不可控。百煉的安全機制確保Agent始終在預設的權限范圍內行動。

在生態策略上，百煉保持開放接入。峰會當天，阿里云宣布與月之暗面、Minimax、智譜、階躍星辰、愛詩科技、生數科技等達成合作，GLM-5.1、MiniMax M2.7、Kimi K2.6、Pixverse-v6-it2v、Kling-v3-omni-video-generation、Vidu Q3-Pro等模型已上架百煉，并通過千問云官網全面售賣。目前百煉已提供150多款主流模型API。

百煉不僅提供阿里自研模型服務，同時面向頭部AI廠商開放，為用戶提供“一個入口、多模型可選”的一站式服務體驗。目前百煉已推出按需、按時長的靈活計費模式，用戶可通過統一SDK接口接入不同模型，實現靈活切換與高效迭代。據阿里最新財報，截至2026年3月，百煉平臺該季度客戶數量同比增長了8倍。

五、首發千問云，全面Skill和CLI化，對Agent更友好

千問云是阿里云成立17年來，首次在阿里云官網之外推出的全新產品官網。打開頁面，突出的不是產品列表，也不是控制臺，沒有任何傳統意義上的導航結構。首頁只有一行字：

安裝 Skills npx skills add QianWen-AI/qianwen-ai

這是一條Agent可讀的prompt指令。阿里云將所有模型服務的核心能力封裝為標準化的Skills和CLI工具，智能體可以直接解析這條指令，“學會”網站的全部能力，并根據需求自主調用。

過去十年，云的交互邏輯是“人登錄控制臺→選產品→配參數→調API”。這套流程對人類來說已經足夠順暢，但對Agent來說完全不可用。Agent不看網頁，不點按鈕，它需要的是結構化的能力描述、明確的調用協議和可預期的反饋機制。

千問云Skills將模型選型、調用、認證配置、用量查詢等完整鏈路能力封裝，用戶無需編寫任何代碼，Agent即可動態路由不同模型——自動用視覺模型處理圖片，用生圖模型生成圖片，用視頻生成模型創作視頻。千問云CLI則可覆蓋登錄認證、模型查詢、調用、用量查詢和環境診斷等能力，直接通過腳本或命令行自動化完成所有模型服務的工作流。

基于千問云Skills和CLI，Agent還能實時拉取模型用量數據，自動分析趨勢、識別異常，為用戶提供成本優化建議。目前，千問云Skills和CLI均已在GitHub開源。付費模式上，千問云提供按量付費和Token Plan訂閱兩種模式，后者適用于高頻AI編程和Agent場景，可顯著降低Token成本。

結語：全球云巨頭展開AI全棧競賽

當云的主要消費者從人變成Agent，所有圍繞人類設計的界面、流程和交互邏輯，都將被重寫。

從芯片真武M890，到Agentic Cloud，到Qwen3.7-Max，到百煉平臺，再到千問云……阿里云在2026年5月20日這一天，完成了一次從底層到入口的全鏈路重構。

放眼全球，這場競賽剛剛進入深水區。谷歌以TPU+Gemini+GCP構筑閉環，亞馬遜以Trainium+Nova+AWS正面迎戰，微軟手握Maia+ Copilot+Azure。而阿里云此次亮出的“芯-云-模型-推理”全棧體系，證明了中國云廠商有能力在同一張牌桌上競爭。

吳泳銘在財報電話會上把AI投入比作建設“訓練工廠”和“推理工廠”。今天，這兩座工廠已經開始全速運轉。未來三年，阿里云的AI算力規模將比2022年增長十倍，是已經在執行的計劃。

值得一提的是，阿里云選擇了“開放”作為差異化路徑——百煉平臺接入150多款模型，千問云Skills和CLI全部開源，這既是生態策略，也是對Agent時代“沒有一家模型能通吃一切”這一底層判斷的回應。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.