![]()
編輯|吳昕
這一年多來,Agent「外掛」幾乎快把打工人「爽」上天。
只需一句話,它就能秒級吐出數(shù)萬字深度報告,甚至直接交付一款軟件。把孩子照片剪成 Vlog 發(fā)給老公,或者替你操控瀏覽器訂機票、填表單,也不在話下。
如今,這種「起飛」的絲滑體感正在反向擠壓底層云服務(wù),掀起一場「土地」風暴。
「 4 年前做 AI 要買算力卡,3 年前要卷大模型,而今天,做 AI 就是開發(fā)和用好智能體。」在 6 月 5 日的 INSPIRE 創(chuàng)想者大會上,華為公司董事、華為云 CEO 周躍峰用一句話點破了行業(yè)拐點,并將一個新概念推向臺前——硅基黑土地。
![]()
華為公司董事、華為云CEO周躍峰
過去,云服務(wù)被稱為「算力黑土地」。企業(yè)要種 AI,先得有地、有水、有電,也就是算力、存儲、網(wǎng)絡(luò)和數(shù)據(jù)庫。但 Agent 時代,它必須變成適合「種植」智能體的「硅基黑土地。」
也是在這一天,華為云一口氣砸下四大層面、十余款 Agentic AI 新品。
從「算力」到「硅基」,兩字之變,背后是大廠解題思路的重要轉(zhuǎn)向:不再倒賣散裝算力,而是重新定義 Agent 時代智能體生長和進化的底層土壤。
先把 Agentic Infra 這層土壤變厚
當一批數(shù)字「勞動力」進入企業(yè)流程,一次看似簡單的任務(wù),背后可能是幾十次模型調(diào)用、多個工具鏈切換、一串沙箱環(huán)境啟動、長時間上下文保存,以及 CPU、NPU、存儲、網(wǎng)絡(luò)之間連續(xù)不斷的資源調(diào)度。
這時候,僅僅死磕模型參數(shù)、 GPU 數(shù)量,遠遠不夠。誰能把 Token 效率、記憶、調(diào)度、安全這些底層能力做得扎實,才有可能讓上面的 Agent 真正長出來。
這正是華為云提出「硅基黑土地」的原因。
在這次 INSPIRE 創(chuàng)想者大會上,華為云正式提出 Agentic Infra 新范式:高效 Token 工廠、持續(xù)學習、通智一體化調(diào)度、安全自治。
![]()
四個關(guān)鍵詞,正好對應(yīng) Agent 大規(guī)模落地的四個基礎(chǔ)難題。
第一個難題,是 Agent 不能慢。
人和聊天機器人對話,等幾秒還能接受。但 Agent 要連續(xù)思考、連續(xù)調(diào)用工具、連續(xù)執(zhí)行任務(wù)。每一步慢一點,整條任務(wù)鏈路就會被拖成「龜速」。
一旦進入客服、研發(fā)、金融風控、工業(yè)調(diào)度這些真實生產(chǎn)系統(tǒng),慢和不穩(wěn)定都會變成業(yè)務(wù)風險。
所以,華為云推出 AICS 靈衢智算集群——憑借創(chuàng)新性的靈衢 UnifiedBus(UB)統(tǒng)一總線協(xié)議+基于 SuperPoD 超節(jié)點架構(gòu),AICS 打破傳統(tǒng)服務(wù)器的物理邊界,讓大規(guī)模智算集群更像一臺邏輯上的「巨型計算機」,也把云底座變成了一個高效 Token 工廠。
![]()
在集群規(guī)模與算力上,最大可落地 10 萬卡超大型智算集群,整體總算力達 200EFLOPS。
在 Token 生產(chǎn)能力上,千卡硬件每秒 Token 吞吐量達 500 萬,推理單 Token 生成時延壓縮至 10ms 以內(nèi),滿足 Agent 實時交互、高并發(fā)在線推理需求。
在服務(wù)穩(wěn)定性上,靈衢智算集群基于全鏈路可觀測與多級快恢能力,支持在線推理服務(wù)達到 99.95% 的可用性。
第二個難題,是 Agent 不能只有「魚的記憶」。
AMS Agentic 記憶存儲解決方案,通過 PB 級記憶空間、KV Cache 分層池化、長上下文和多輪記憶管理,讓 Agent 可以保存更長時間的任務(wù)狀態(tài)和經(jīng)驗。換句話說,就是給智能體配一個更大的「工作記憶」和「長期記憶」。
這對企業(yè)級 Agent 很關(guān)鍵。真正的企業(yè)任務(wù)很少一次問答就結(jié)束。一個研發(fā)任務(wù)可能跑幾個小時,一個數(shù)據(jù)分析任務(wù)可能跨多個系統(tǒng),一個行業(yè)智能體甚至要在多輪反饋里不斷修正策略。
Agent 要從「能回答」走向「能長期干活」,記憶能力必須成為基礎(chǔ)設(shè)施的一部分。
第三個難題,是算力資源要調(diào)得動。
Agent 的工作流很雜。有時要跑大模型推理,有時要啟動沙箱執(zhí)行代碼,有時要讀寫存儲,有時要調(diào)用傳統(tǒng)業(yè)務(wù)系統(tǒng)。訓練、推理、Agent 負載、通用微服務(wù),都會混在一起搶資源。
如果底層調(diào)度還停留在傳統(tǒng)云原生時代,就很容易出現(xiàn)尷尬局面:算力拼不起來、調(diào)不動也用不滿,任務(wù)一多還打架。
通智一體化調(diào)度引擎 CCE VolcanoNext ,利用精密的「軟件調(diào)度技術(shù)」、通過兩個關(guān)鍵動作,立馬讓整體硬件利用率提升了 30% 以上。
一個是「訓推共池」。
把原本割裂的訓練和推理算力揉成一張網(wǎng),讓訓練、推理、Agent 等多種負載可以在同一資源池里動態(tài)復用。
另一個是「碎片整合」,變廢為寶。
訓練任務(wù)里常常會有很多細碎的資源空隙。 CCE VolcanoNext 能將極其零碎的算力「偷」出來,瞬間打包塞給正在等待響應(yīng)的在線推理任務(wù)(比如去生成一個 Token ),讓算力流失率趨近于零。
第四個難題,是 Agent 必須管得住。
企業(yè)不是不想用 Agent,而是不敢隨便讓 Agent 進生產(chǎn)系統(tǒng)。畢竟能力越強,風險越大,企業(yè)越容易緊張。
這也是 AgentSphere 的定位——它提供的是生產(chǎn)級智能體運行環(huán)境,把沙箱隔離、身份權(quán)限、意圖防護、雙向網(wǎng)絡(luò)防護、行為審計放進同一個底座里。
同時,它還足夠快。
AgentSphere 通過羽量級沙箱技術(shù),實現(xiàn) 100ms 級啟動和每分鐘十萬級批創(chuàng)能力,既能支撐 Agent Serving 里的工具調(diào)用,也能支撐 Agentic RL 里大規(guī)模沙箱高頻創(chuàng)建。
ModelArts+AgentArts:
再讓企業(yè)級智能體觸手可及
話又說回來,企業(yè)真正需要的,是上面這些裸算力嗎?其實不是。
與其說人們需要的是電,不如說是那些真正進入生活、解決問題的電器。傳統(tǒng)企業(yè)也一樣,他們更需要可自由支配的模型和智能體能力。
所以,在 Agentic Infra 之上,華為云繼續(xù)鋪了兩層能力:ModelArtsNext 和 AgentArts。前者解決「模型怎么用得更好」,后者解決「 Agent 怎么跑進企業(yè)」。
![]()
先看 ModelArtsNext
過去很多 MaaS 平臺像一個模型貨架:這里有 DeepSeek,那里有 Qwen,還有自家的模型,用戶自己選、自己調(diào)、自己試。
但 Agent 時代,這種方式會很快遇到問題。一個企業(yè)任務(wù)可能并不只適合一個模型。寫代碼、做客服、查知識庫、跑推理、處理多模態(tài)內(nèi)容,不同環(huán)節(jié)對成本、速度、效果的要求都不一樣。
這時候,關(guān)鍵不只是「有多少模型」,而是能不能把合適的請求,分給合適的模型。
ModelArtsNext 的模型路由能力,應(yīng)運而生。它可以根據(jù)請求特征、實時負載和使用體驗,動態(tài)選擇更合適的模型。用戶可以選擇成本優(yōu)先、效果優(yōu)先,或者均衡模式,讓系統(tǒng)在不同任務(wù)之間自動做取舍。
這聽上去像一個后臺調(diào)度功能,但對企業(yè)來說很重要。
因為企業(yè)不是在玩模型評測榜,而是在算真實成本:同樣一個任務(wù),能不能少花一點 Token?同樣一套應(yīng)用,能不能既保證效果,又把推理成本壓下來?
除了模型路由,ModelArtsNext還把 RLaaS、機密推理和模型矩陣打包進來。
RLaaS(強化學習服務(wù))讓企業(yè)可以用強化學習繼續(xù)優(yōu)化自己的智能體,讓模型在真實業(yè)務(wù)反饋中越用越聰明。
機密推理面向金融風控、AI 編碼等高敏感場景,解決數(shù)據(jù)可信和安全調(diào)用問題。
此外,華為云提供豐富的模型矩陣能力,實現(xiàn)了主流 SOTA 模型(如 DeepSeek、Kimi、智譜GLM等)Day0 上線,能力覆蓋編程、多模態(tài)等豐富場景。企業(yè)可通過 Tokens API、工具鏈、Agent 開發(fā)平臺、智能體應(yīng)用 4 種形態(tài)輕松調(diào)用。
![]()
再往上,就是 AgentArts,負責把模型能力封裝成靠譜、合格的「數(shù)字員工」。
企業(yè)級 Agent 一旦進入生產(chǎn)環(huán)境,就如同可能影響業(yè)務(wù)結(jié)果的數(shù)字員工,怎么樣才能讓這位「員工」穩(wěn)定、可控、可持續(xù)地進入工作流?
AgentArts 對應(yīng)的,正是這套生產(chǎn)級要求。
其中,長程任務(wù),解決的是 Agent 能不能連續(xù)干活的問題。企業(yè)任務(wù)往往不是一問一答,而是持續(xù)數(shù)小時甚至數(shù)天的流程。AgentArts 要保障任務(wù)不中斷、異常能恢復、上下文能延續(xù)。
企業(yè)級安全,解決的是 Agent 能不能放心用的問題。它需要會話隔離、權(quán)限管控、隱私數(shù)據(jù)保護和安全沙箱,不能讓一個能調(diào)用工具的智能體隨便越權(quán)。
行業(yè)知識深度,解決的是 Agent 能不能懂業(yè)務(wù)的問題。不同企業(yè)、不同崗位、不同流程,都有自己的知識、規(guī)則和經(jīng)驗。Agent 要真正干活,就必須把這些行業(yè)資產(chǎn)吃進去。
全鏈路可觀測,解決的是 Agent 出問題后能不能查清楚的問題。它做了什么、調(diào)用了什么工具、哪一步失敗、為什么失敗,都要能被追蹤和復現(xiàn)。
基于華為云 AgentArts 平臺,企業(yè)可以從 300 多個行業(yè)資產(chǎn)中靈活選取,組合出適合自己的智能體能力。從實際落地來看,這套能力已經(jīng)開始跑進真實業(yè)務(wù)場景。
例如,溫氏集團通過華為云 AgentArts,基因組分析效率提升 50%,AI 解讀成功率高達 95 %以上。此外,遺傳評估準確率同步提升 15%。
比起數(shù)Token,華為云更關(guān)心它們?nèi)チ四睦?/strong>
過去一年,AI 云廠商被 Token 卷上了天。
模型調(diào)用量、Tokens 產(chǎn)出、推理成本、API 價格,幾乎成了衡量 AI 云熱度的新尺子。
誰能承接更多模型調(diào)用,誰能生產(chǎn)更多 Token,誰就更像握住了 AI 云時代的新增長入口。
華為云沒有回避 Token 經(jīng)濟,也在建設(shè)高效 Token 工廠、MaaS 模型即服務(wù)和 Agentic Infra,但它又不想陷入互聯(lián)網(wǎng)的這套排行榜里。
在媒體見面會上,周躍峰說得很直白:華為云「不太在乎 Token 總量是多少」,也「不太在乎收入的總量是多少」,更在乎國產(chǎn)化算力系統(tǒng)生產(chǎn)出來的 Tokens 背后,能不能帶來健康提升、節(jié)電和生產(chǎn)力提升,而不只是情緒價值。
![]()
這句話聽起來有點反增長敘事,其實點出了華為云和互聯(lián)網(wǎng)云廠商的關(guān)鍵差異。
來看一個醫(yī)療案例。針對中國病理醫(yī)生缺口高達14 萬的結(jié)構(gòu)性挑戰(zhàn),上海瑞金醫(yī)院聯(lián)合華為,歷時一年半打造了 RuiPath 病理大模型。
這是國內(nèi)首個進入醫(yī)院生產(chǎn)流程的臨床級病理大模型,可覆蓋 90% 的常見癌種和 90% 的下游診斷任務(wù)。
![]()
研發(fā)過程中,瑞金醫(yī)院提供了百萬張高質(zhì)量數(shù)字病理切片和寶貴臨床數(shù)據(jù)。華為云提供的是數(shù)據(jù)工程、模型工程、應(yīng)用工程以及全流程工具鏈支持。
現(xiàn)在,RuiPath 正在按照「頂級醫(yī)院研發(fā)驗證—地市三甲醫(yī)院擴展—縣域醫(yī)院復制應(yīng)用」的路徑向外擴散。短短幾個月,朋友圈已擴展到全國 20 多家醫(yī)院。
比如,邯鄲市中心醫(yī)院,通過每輪幾十張切片的小樣本微調(diào),讓本地乳腺癌有無腫瘤判別準確率提升到接近 100%。
涉縣醫(yī)院、武安市第一人民醫(yī)院這樣的區(qū)域醫(yī)院,也可以在數(shù)據(jù)不出域、安全可控的前提下,通過端云協(xié)同享受到頂尖專家的診斷能力。
這才是華為云口中「有價值的 Token」。
它對應(yīng)的不是一次聊天、一段生成文本、一個 API 調(diào)用,而是一次更準確的病理判斷,一次基層醫(yī)院診斷能力的提升,一次優(yōu)質(zhì)醫(yī)療資源的下沉。
這一核心差異化,可以追溯到華為最初進入云市場時的底色。
早在多年以前,華為云就曾明確提出,未來 AI 的主場在行業(yè),并把公有云作為面向未來的重要戰(zhàn)略。那時,很多政府和企業(yè)客戶才剛剛開始上云,而政企、運營商、金融、制造、能源等 2B 場景,恰恰是華為長期深耕的領(lǐng)域。
所以從一開始,華為云的云業(yè)務(wù)就帶著很強的行業(yè)屬性,關(guān)心的是怎樣把云、AI、數(shù)據(jù)和行業(yè)系統(tǒng)結(jié)合起來,變成真實生產(chǎn)力
相比之下,互聯(lián)網(wǎng)大廠的基因造就了另一套打法。
他們天然擁有高頻流量場景、C 端應(yīng)用、內(nèi)容平臺和開發(fā)者生態(tài)。這些會帶來海量模型調(diào)用,也會反過來推動模型能力、推理平臺和工具鏈快速迭代。
他們的 2B 能力,很多時候也是從高頻互聯(lián)網(wǎng)場景、開發(fā)者生態(tài)和大規(guī)模模型調(diào)用中外溢出來的。
如果 Token 要真正轉(zhuǎn)化為生產(chǎn)力,就必須進入政企、傳統(tǒng)企業(yè)的業(yè)務(wù)流程,一對經(jīng)典矛盾也接踵而至:
傳統(tǒng)企業(yè)組織機構(gòu)復雜、業(yè)務(wù)系統(tǒng)復雜、手握高敏感數(shù)據(jù)、安全合規(guī)要求極高,對本地化部署、數(shù)據(jù)不出域、業(yè)務(wù)連續(xù)性都有明確訴求。但模型和算力迭代又非常快。如果企業(yè)完全自建,很容易「部署完就落后」。
這就引出了華為云另一個關(guān)鍵差異化:堅持公有云和面向國計民生的混合云「兩條腿走路」。
RuiPath 就是一個很典型的樣本,將原本對立的「數(shù)據(jù)安全」與「先進模型便利」統(tǒng)一起來。
在醫(yī)院端,先通過輕量化工具對原始病理切片進行預處理,提取少量疑似腫瘤區(qū)域特征,再經(jīng)過加密后上傳云端。這樣一來,原始數(shù)據(jù)和核心診療流程仍然留在醫(yī)院可控范圍內(nèi)。
在云端,華為云通過全密態(tài)、「可用不可見」等機制,支撐診斷推理、模型增訓和持續(xù)迭代。云端提供的,是瑞金與華為共建的基礎(chǔ)模型能力、算力能力和工具鏈能力。
基層醫(yī)院只需要利用相當于傳統(tǒng)訓練約 10% 的本院小樣本數(shù)據(jù),就可以在基礎(chǔ)模型之上做本地化適配,快速得到更貼合本院病例特點的專屬模型。
![]()
值得一提的是,雖然云廠商都在講「全棧」,但與華為云「全棧」的「含硅量」和國產(chǎn)化率,存在天差地別
華為是做通信設(shè)備和硬件出身,它的全棧邏輯也向下扎到了最底層的物理世界,如昇騰 NPU、鯤鵬 CPU、CloudMatrix 超節(jié)點等硬核實體。
而且,從最底層的「一粒沙子」(芯片算力),到中間層的底層使能(如CANN 架構(gòu)),再到最上層的智能體平臺,全部都是自研。用周躍峰的話說,華為云要打造不同于「萬國牌」的「另一個算力平面」
對中國企業(yè)而言,這不只是「多了一家云廠商」,而是在主流 GPU 路線之外又多了一種算力選擇、多了一套生態(tài)選擇,也多了一條基礎(chǔ)設(shè)施路線。
開放才能致遠
除了把硅基黑土地做厚,真正讓 AI 長進千行萬業(yè),還需要把已經(jīng)驗證過的技術(shù)、工具鏈和行業(yè)經(jīng)驗開放出去,這也是 INSPIRE 創(chuàng)想者大會發(fā)布「行業(yè) AI 夢工廠」的意義。
首批「夢工廠」包括醫(yī)療、具身智能、科學計算、智能制造等垂直領(lǐng)域,開放華為長期積累的技術(shù)能力、工具鏈和實踐經(jīng)驗,讓行業(yè) AI 不再停留在少數(shù)標桿項目里,而是進入可復制、可共建、可持續(xù)迭代的新階段。
![]()
開放,也貫穿在華為云的底層生態(tài)里。
從鯤鵬、昇騰,到歐拉操作系統(tǒng)、CANN 系統(tǒng),再到 CCE Volcano、ModelArts 工具鏈,以及與AgentArts 企業(yè)版內(nèi)核同源度超過 90% 的openJiuwen,華為云正在把更多能力以開源開放的方式交給產(chǎn)業(yè)。
周躍峰說,希望華為云在智能體時代成為一朵最開放的云。最終,讓智能體開發(fā)這件事變得更普惠。
![]()
任正非曾說,在方向大致正確的情況下,要先開一槍,不能等,大膽往前走。過去多年,華為云押注行業(yè)、押注國產(chǎn)化、押注全棧能力,這條路并不輕松,也不會立刻見效,但也從未動搖。
有人說,一旦認定一件事,便全力以赴。在業(yè)內(nèi),華為的執(zhí)行力令許多競爭對手忌憚。
確實。沒有一件事情可以隨隨便便成功,但是認真干起來,也不可能不成功。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.