![]()
“Why not?”
在號稱“云計算”春晚的2025年亞馬遜云科技re:Invent大會上,亞馬遜云科技CEO Matt Garman演講中就拋出一連串問題:“為什么開發(fā)者不能專注于構(gòu)建而非基礎(chǔ)設施?為什么實驗時間與成本不能趨近于零?為什么不能讓每一個想法都成為可能?”
事實上,Matt Garman以上提問,都直指近年AI Agent火熱浪潮中,一直困擾企業(yè)群體如何真正釋放生產(chǎn)力的核心命題。歷年來,全球企業(yè)核心訴求需求沒有根本改變,本質(zhì)仍在于提高效率(SaveTime)。這也是多年來,亞馬遜云科技這家業(yè)務規(guī)模已達1320億美元的全球云巨頭一直聚焦的工作。
Agentic AI時代,AI Agent不是手段也不是目的,而成為生產(chǎn)力本身,不過前提還在于,需要讓Agent安全合理地落地并實現(xiàn)高效運轉(zhuǎn)。亞馬遜云科技 CEO Matt Garman 在 Keynote 上就談到:“Put Agent into Work。”
事實上,過去數(shù)年AI正在從Copilot向Autopilot加速轉(zhuǎn)化過程中,不少企業(yè)已經(jīng)為“聊天機器人”支付了昂貴的學費,然而實際操作下來,卻發(fā)現(xiàn)輔助式、被動化的問答模式,很難真正讓公司實現(xiàn)業(yè)績實質(zhì)性增長。因此,Matt Garman強調(diào)的“Put Agent into Work”,或許也指向了AI核心定位的變化,即從一種“咨詢顧問”轉(zhuǎn)變?yōu)椤皵?shù)字工人”,需要以一種工作更加主動、細節(jié)更加精準、安全更加可控的行為模式,為企業(yè)切實創(chuàng)造價值。
如果細看2025年re:Invent大會上關(guān)鍵人物的發(fā)言傾向,不難發(fā)現(xiàn),從亞馬遜云科技首席執(zhí)行官Matt Garman到亞馬遜云科技Agentic AI副總裁Swami Sivasubramanian,再到亞馬遜云科技高級副總裁Peter DeSantis,均用了大量篇幅講述AI Agent究竟如何有序、有效、有用地落地。
“未來數(shù)十億Agent將滲透各行各業(yè),助力企業(yè)實現(xiàn)10倍效率躍遷。”Matt Garman在開篇演講中激昂談到。
值得注意的是,近二十年來亞馬遜云科技一直通過推動云計算和生成式AI普及在各行各業(yè)“搭臺唱戲”,成為全球企業(yè)群中效能放大器的典范,“利他戰(zhàn)略”也讓企業(yè)實現(xiàn)了二次成長,僅僅在過去一年,亞馬遜云科技新增營收就達220億美元。
一、利他思維如何更好地“搭臺唱戲”
沒有一個真正的戰(zhàn)略家是對戰(zhàn)術(shù)細節(jié)不熟悉的,一個真正的戰(zhàn)略家也不會將戰(zhàn)略眼界聚焦短期勝敗上。
亞馬遜科技2025年re:Invent大會首日,公司CEO Matt Garman兩個多小時主題演講聚焦與發(fā)散并進,實際上也是以上定論的集中反映。
![]()
一方面,Matt Garman全場兩個多小時的Keynote就發(fā)布新品接近40個,集中展現(xiàn)了亞馬遜云全新一代自研芯片、前沿基礎(chǔ)模型及企業(yè)級模型定制框架等一系列重磅產(chǎn)品,在算力層、模型層和應用層持續(xù)突破,令人有一種應接不暇的感覺。
另一方面,Matt Garman的絕大多數(shù)時間,實際聚焦在了AI基礎(chǔ)設施和全新Agent產(chǎn)品的講解上。對此,Matt Garman直截了當?shù)刂赋觯骸癆I Agent正在把我們帶到AI發(fā)展的關(guān)鍵拐點。未來每家公司,每一個可以想象的領(lǐng)域中都會運行數(shù)十億個Agent!”
什么讓亞馬遜云科技有了這樣的判斷?這與近些行業(yè)在AI浪潮中所處的一個尷尬境遇密不可分:僅從目前來看,AI浪潮助力下的企業(yè)仍無法實現(xiàn)投入產(chǎn)出比的均衡,巨額投入什么時候才能轉(zhuǎn)化為企業(yè)實實在在的業(yè)績反映,也成為困擾眾多企業(yè)CEO的難題。
為了破局,為了讓AI從Assistant加速質(zhì)變成能主動干活、充分釋放生產(chǎn)力的Agent,并且讓Agent更可信、更好用、更可控、成本更低,亞馬遜云開出了自己完整的解決方案,即算力基礎(chǔ)設施、推理平臺、數(shù)據(jù)、還有實現(xiàn)Agent 的一系列工具鏈。
貫穿亞馬遜云科技以上解決方案的核心思路則在于,向下自研芯片,以性價比夯實算力底座,中間擴充模型,提供給客戶更多、更厚的選擇,向上則樹立規(guī)則,嚴格把控Agent實際操作風險,從而真正達成一整套可用、可信、可控的技術(shù)閉環(huán)。
比如說,當下Agent對Token消耗量,已經(jīng)達到了較為簡單AI對話的十倍以上。為此,如何更直接地降低Token成本,為企業(yè)提供性價比算力基礎(chǔ)設施配套,就成為亞馬遜云科技的一大發(fā)力點。
在備受期待的算力基礎(chǔ)設施構(gòu)建上,亞馬遜云科技一方面作為運行NVIDIA GPU的核心場所之一,積累了大規(guī)模的GPU運行經(jīng)驗,由此,本次大會公司例舉P6e GB200 超級服務器就相比上一代 P5e,計算性能提升超過20 倍。
此外,亞馬遜云科技始終沒有減緩自身底層芯片布局。本次大會上,Matt Garman宣布正式推出了最新Trainium3,并且發(fā)布Amazon Trainium3 UltraServers,這也成為亞馬遜云科技首款搭載3納米工藝AI芯片的服務器。
相較Amazon Trainium2,不僅計算能力提升4.4倍、內(nèi)存帶寬提升3.9倍,每兆瓦算力可處理的AI token數(shù)量達成了5倍增長,為大規(guī)模 AI 訓練與推理帶來顯著的效率與能效優(yōu)勢。并且,新一代服務器在運行OpenAI的GPT-OSS-120B模型時,每兆瓦輸出token數(shù)是Amazon Trainium2的5倍以上,可實現(xiàn)更極致的能耗比。
大會上,Matt Garman還首次披露了Amazon Trainium4芯片,承諾將實現(xiàn)較Amazon Trainium3 UltraServers六倍的FP4計算性能、四倍內(nèi)存帶寬和兩倍高內(nèi)存容量,繼續(xù)堅守亞馬遜云科技在AI芯片領(lǐng)域的長期投入的戰(zhàn)略定力。
![]()
值得注意的是,基礎(chǔ)算力的底座夯實上亞馬遜云科技常年持續(xù)投入,如今已完成超100萬個Amazon Trainium2芯片規(guī)模化部署,為Amazon Bedrock中大部分推理工作提供了穩(wěn)定可靠的算力支持,并且已為公司帶來了幾十億美元可觀收入。
某種程度上說,也正式由于亞馬遜云科技對自研芯片持續(xù)的投入,也讓公司在當下越發(fā)復雜的競爭環(huán)境中擁有了更多主動權(quán)。尤其是在算力即權(quán)力的當下,一旦企業(yè)的核心利潤被上游硬件廠商大幅拿走,那么云廠商在博弈中占據(jù)主動。
從這點上說,亞馬遜云科技自研芯片構(gòu)建發(fā)力點不僅僅是技術(shù)壁壘,更是一種構(gòu)建自身UE的必然:尤其是當Agent時代來臨,Token消耗量呈現(xiàn)出指數(shù)級增長時,要想實現(xiàn)商業(yè)更長久健康的盈利,基礎(chǔ)算力上的“自研”與“降本”必不可少。
除了算力,第三方模型引用上Amazon Bedrock也持續(xù)豐富著客戶模型選擇權(quán),在“利他戰(zhàn)略”下持續(xù)開源、繼續(xù)“搭臺唱戲”。大會現(xiàn)場,亞馬遜云科技展現(xiàn)出一種更為開放姿態(tài),Matt Garman則向世人宣布,公司收錄了更多開源、通用、專用等多種類型的模型。其中,Amazon Bedrock就收錄了包括谷歌的 Gemma、NVIDIA的Nemotron,Kimi和Minimax 廠商的最新模型,真正為亞馬遜云科技的客戶提供了模型運用上更廣闊的空間。
與此同時,亞馬遜云科技也在讓自身大模型繼續(xù)進化,大會現(xiàn)場同步了Amazon Nova迭代到了Amazon Nova 2的最新進展。該大模型包含Amazon Nova 2 Lite、Amazon Nova 2 Pro、Amazon Nova 2 Sonic、Amazon 2 Omni四個版本可供客戶在不同場景中調(diào)用,延續(xù)了強大智能能力同時,也持續(xù)將成本效率與低延遲表現(xiàn)大幅提升。
并且,Amazon Nova 2實際測試中各個版本性能表現(xiàn)也都可圈可點。例如,Amazon Nova 2 Lite 性能就可比肩 GPT-5 Mini、Claude Haiku 4.5等業(yè)界先鋒模型。此外,Amazon Nova 2 Pro 在指令遵循、Agentic工具使用等基準上超越 GPT-5.1、Gemini 3 Pro Preview 以及 Claude Sonnet 4.5,進步顯著。
而在數(shù)據(jù)層面, Amazon AI Factories的推出,則更能反映公司的“利他戰(zhàn)略”:對于某些特殊客戶來說,數(shù)據(jù)處境與安全始終擺在第一性,為此,Amazon AI Factories一經(jīng)推出,就可將全套的 AI 算力集群、網(wǎng)絡架構(gòu)、存儲設施,直接打包運到客戶的本地數(shù)據(jù)中心里,實現(xiàn)了安全與算力的平衡統(tǒng)一。
事實上,Amazon AI Factories的推出,也在某種程度上揭示了一種云計算敘事邏輯的改變:過去多年,企業(yè)大趨勢是“上云”,可到AI時代后,由于數(shù)據(jù)主權(quán)、隱私和安全問題左右,如何讓“云下來”,則成為一種維護數(shù)據(jù)資產(chǎn)的必然選擇。
二、怎么讓Agent可信、可靠、可用?
除了基礎(chǔ)算力與模型擴展,亞馬遜云科技2025 re:Invent大會上,還創(chuàng)造性提出了如何幫助客戶“調(diào)教”出一個可控、可用、可信的Agent。某種程度上說,以上技術(shù)路線上展現(xiàn)的切實性,也是亞馬遜云科技核心競爭力的一種外化。
例如,當大多數(shù)平臺還在比拼Agent框架靈活性、推理速度時,亞馬遜云科技則更為敏銳又貼切地意識到,或許企業(yè)需要的不是一個能聊天的機器人,而是一個能干活的員工。
![]()
為此,亞馬遜云科技圍繞如何讓Agent安全合理地高效落地,去解決企業(yè)種種核心痛點,大會上就推出了Agentic AI平臺Amazon Bedrock AgentCore。在該平臺“約束”下,Agent 的日常使用、行為秩序得到了更好的秩序,由此公司則可大規(guī)模地安全構(gòu)建、部署和運行高性能的Agent。
為了確保Agent運行過程中的安全性與合規(guī)性,亞馬遜云科技則開放了AgentCore Policy、AgentCore Evaluations 功能。此舉的啟迪意義,或許不止于幫助客戶規(guī)避失序風險,更在于亞馬遜云科技嘗試著定義出Agent時代下一種全新的治理范式。
這已經(jīng)不是一種簡單的程序約束,而是給Agent制定出了一套行事準則,甚至說“法律法規(guī)”。由此一來,用戶在Agent運行過程中,就可以從人類行事的邏輯去規(guī)勸、約束AI,只有這樣,企業(yè)的更多核心業(yè)務或許才會讓Agent落地產(chǎn)生可能。
這也觸及到了Agent大規(guī)模落地的真正痛點。某種程度上說,大模型有一定概率性,可回到企業(yè)業(yè)務流程中,尤其涉及到財務層面,需要的必須是100%的確定性。事實上,企業(yè)群體頭疼的往往不是AI不夠聰明,而是AI“一本正經(jīng)地胡說八道”或“違規(guī)”越權(quán)操作。從這點上說,Amazon Bedrock AgentCore的核心價值或許就在于,給相對不可控的Agent加上確定性“枷鎖”后,很多風險將會被隔絕。
事實上,Agent興起的潮流下,圍繞“風險”衍生出大量核心的討論:比如在企業(yè)核心業(yè)務的使用場景下,一個不可控的Agent會展現(xiàn)出如何巨大的破壞力?這樣的猜想在不少科幻電影中已經(jīng)出現(xiàn)了大量發(fā)人深省的故事。
正因如此,除了Amazon Bedrock AgentCore,如何更快、更安全地將Agent加入到日常工作中來,亞馬遜云科技也提出自己一系列方案。比如,Amazon Quick 作為一款面向企業(yè)的智能 Agent 應用,不僅能夠幫助用戶進行深度分析、數(shù)據(jù)可視化和工作流自動化,還可以通過企業(yè)級的安全與隱私標準確保信息的可靠性與合規(guī)性。
除此之外,在備受關(guān)注的AI 編程領(lǐng)域,亞馬遜云科技在大會現(xiàn)場,也提出了三大Agent——比如,Kiro autonomous agent,可以作為虛擬開發(fā)者,持續(xù)分擔人類工作,并且能夠獨立完成各項任務,并在工作中持續(xù)學習拓展能力邊界。再比如,Amazon Security Agent則可以承擔虛擬安全工程師的角色,在應用設計、代碼審查與滲透測試等環(huán)節(jié)充當起企業(yè)的安全顧問,極大降低安全風險。還有可以幫助開發(fā)者,尤其是負責值班的工程師,主動發(fā)現(xiàn)系統(tǒng)故障或潛在缺陷的Amazon DevOps Agent。
從這點上說,鑒于亞馬遜云科技在服務行業(yè)二十年來積累的大量經(jīng)驗,無疑不在證明,各行各業(yè)、不同規(guī)模的組織面臨的需求痛點,都讓這家企業(yè)能在第一時間準確捕捉,由此根據(jù)企業(yè)現(xiàn)實存在的痛點。
并且,此次大會基于底層算力、推理平臺、數(shù)據(jù)再到Agent產(chǎn)品鏈路,亞馬遜云科技在今年 re:Invent 上展現(xiàn)出的,或許是自身一步步地把早期具有“玩樂”屬性、技術(shù)噱頭的Agent ,由此正式推向商業(yè)實戰(zhàn)中。
三、在Agent時代,找回丟失的創(chuàng)造力
過去兩年,我們無不見證了大模型帶來的顛覆,同時也看到了其呈現(xiàn)的局限性。
比如,大模型或許能寫詩作畫,卻很難替用戶解決更多實際問題,比如買一張機票:從這點上說,Agent與傳統(tǒng)大模型助手的核心區(qū)隔,或許就在于分自主行動力。
在這一視角下,Agent需要擔負起的責任,則更加精細化,是一個能夠主動執(zhí)行任務、在復雜環(huán)境中實現(xiàn)動態(tài)推理、并讓工作流程自動化的“數(shù)字員工”,也是一種未來生產(chǎn)力的集中釋放。
亞馬遜云科技2025 re:Invent 大會上,亞馬遜云科技Agentic AI高級副總裁Swami Sivasubramanian的Keynote上,就圍繞Agent如何重塑商業(yè)世界的可能展開了核心推論。
![]()
比如,AI Agent 如何才能實現(xiàn)真正的大規(guī)模生產(chǎn)落地,從而將概念性變?yōu)檎媲械纳a(chǎn)力提升?
Swami Sivasubramanian的Keynote上提到了一個生動案例:當我們最早寫下第一行代碼時是怎樣的感覺?這樣一種類似造物者、仿佛能做到任何事的創(chuàng)作自由,在Agent 時代又該如何找回?
事實上,以往用戶無拘無束、無所不能的創(chuàng)作欲表現(xiàn),到了現(xiàn)在,卻隨著 AI 系統(tǒng)的日益復雜,變得更加難以實現(xiàn):尤其是那些概念驗證階段看似表現(xiàn)良好的AI,一旦進入大規(guī)模應用,卻往往因為邏輯脆弱、缺乏模塊化,從而對用戶想象力、生產(chǎn)力的激發(fā)產(chǎn)生了一種反作用。
為了解決以上痛點,亞馬遜云科技則將發(fā)力點聚焦到了“簡潔性”上。比如,一個Agent往往由基礎(chǔ)模型、代碼和工具三大組件構(gòu)成,協(xié)同編排這些組件往往比較繁瑣,為此,亞馬遜云科技則發(fā)布并開源了Amazon Strands Agents SDK。
這一框架也被引入了TypeScript 平臺,今后,開發(fā)者則能夠利用熟悉的工具棧構(gòu)建完整出Agent 堆棧。更關(guān)鍵的是,Strands 還新增了對邊緣設備的支持。這意味著,未來Agent將不再局限于云端服務器,而是可以運行在汽車、游戲機甚至機器人終端上。值得注意的是,短短數(shù)月,該SDK 下載量突破 500 萬次,再次證明了開發(fā)者對“簡潔性”的青睞。
另一個制約生產(chǎn)力解放的直接命題,也被Swami關(guān)注到了。比如,為了解決當下AI普遍存在的“健忘癥”、即無法在長期交互中沉淀經(jīng)驗,Amazon Bedrock AgentCore Memory推出后,則接入了全新的情景式記憶功能,能夠讓Agent從過往的上下文、推理過程、操作結(jié)果中持續(xù)學習,并將這些信息應用于后續(xù)交互。
在幫助Agent解決了“聰明”的能力后,亞馬遜云科技也對其效率提升,集中下手。Swami 更是直言:“效率關(guān)乎成本、規(guī)模與敏捷性。”
![]()
事實上,盡管通用的基礎(chǔ)模型雖然“智商高”,但在處理特定任務時,往往伴隨著高昂的成本和延遲。由此,企業(yè)特定使用場景中,“小而美”的高質(zhì)量定制模型已漸成主流。
這也是AI開發(fā)模式一種必然的“祛魅”過程。以往,行業(yè)迷信“參數(shù)至上”,不過,Swami的觀點則強調(diào)專用性一定程度、一定場景下,無疑將會優(yōu)于通用性。類似一家企業(yè)不需要一個樣樣稀松的通才,相反,去打造成百上千個精通業(yè)務細節(jié)的專才,或許才能真正釋放生產(chǎn)力。
基于此,亞馬遜云科技也打出了一套組合拳。比如,RFT可讓定制模型的準確率相比基礎(chǔ)模型提升 66%。再加上Amazon Nova Forge開創(chuàng)了“開放式訓練”的先河,允許企業(yè)在訓練各階段注入專有數(shù)據(jù),讓模型不僅懂通用知識,更懂企業(yè)的“行話”。
以上這一切,也讓定制化實現(xiàn)效率大幅提升成為一種未來的趨勢。并且,在讓Agent變得更聰明、更具效率的同時,如何確保成百上千個Agent 被部署在生產(chǎn)鏈條的風險把控,也成為了一大重點。
對此,Swami則進一步將失序把控的解決方案細化給出。除了先前介紹的Amazon Bedrock AgentCore,為了進一步提升可靠性,亞馬遜云科技還推出Amazon Nova Act。這是一套用于構(gòu)建可靠 UI 工作流程的全新服務,由定制版的 Amazon Nova 2 Lite 模型驅(qū)動。它結(jié)合了自動推理(Automated Reasoning)的數(shù)學邏輯驗證,在早期測試中實現(xiàn)了高達 90%的可靠性。
甚至,在現(xiàn)場演示的“反電詐”場景中,Agent 不僅能檢查信用卡交易、合理提出懷疑,甚至能收集證據(jù)并協(xié)助報警。這種基于邏輯驗證的嚴謹性,讓“人機信任”不再是一句空話。
四、一條實實在在的道路
大會最后一天,亞馬遜云科技發(fā)布了自身迄今為止性能最強、能效最高的Amazon Graviton5處理器。與上一代相比,基于Graviton5的全新EC2 M9g實例性能提升高達25%,實現(xiàn)了單封裝 192 核心的突破,并將 L3 緩存提升了 5 倍。一個直觀的使用案例是,Apple在遷移核心服務后,實現(xiàn)了成本降低 30%、性能提升 40%的不錯效益。
值得注意的是,目前亞馬遜云科技新增CPU容量中連續(xù)第三年有超半數(shù)由Graviton驅(qū)動,EC2頭部1000家客戶中已有98%受益于其顯著的性價比優(yōu)勢,包括Adobe、Airbnb、Atlassian、Epic Games、Formula 1等。
不僅如此,在亞馬遜云科技re:Invent 2025 最終日,公司從Amazon Graviton5 和Amazon Trainium3 UltraServers的極致能效展示,到Amazon S3 Vectors和Amazon Lambda Managed Instances重新定義了數(shù)據(jù)和無服務器的邊界,并最終通過Project Mantle的系統(tǒng)級創(chuàng)新,再次完整地收束了過去數(shù)天公司想要強調(diào)的AI時代核心理念。
事實上,亞馬遜云科技2025 re:Invent 大會臨近尾聲時,公司則用大量基礎(chǔ)設施產(chǎn)品的密集發(fā)布,重申了一個公司發(fā)展的核心命題:即AI不會顛覆基礎(chǔ)設施,反而會讓基礎(chǔ)設施的安全性、成本和敏捷性等變得更加顯著。
從這點上說,再次回顧亞馬遜云科技2025年re:Invent大會,真正留下的或許不是一串令人眼花繚亂的產(chǎn)品清單,而是一張清晰、實用、貼切的企業(yè)發(fā)展藍圖。
從Nitro到Graviton再到Trainium的完整自研芯片堆棧,以及Apple、Anthropic等重量級客戶背書,亞馬遜云科技的企業(yè)競爭力壁壘中,一直有特殊且務實的底座:即當其他云廠商仍在試圖證明自身“能做 AI”時,亞馬遜云科技則已經(jīng)將視野聚焦到了用“安全性、可用性、成本可控”等,能直達商業(yè)核心的解決辦法,再次證明了自己在AI規(guī)模化、可持續(xù)發(fā)展、盈利實現(xiàn)等方面,于行業(yè)內(nèi)扮演了一個重要且不可或缺的角色。
![]()
值得注意的是,大會最后一天,亞馬遜CTO Dr. Werner Vogels也完成了他在re:Invent的最后一場主題演講,并談到:AI不會取代開發(fā)者,但停止進化的開發(fā)者則會被時代淘汰。
從這點上說,亞馬遜云科技在AI 的聚光燈下,或許選擇了一條最不性感、最不顯眼的道路。從過去到未來,亞馬遜云科技始終在做的事情,核心仍在于為AI時代去“修筑鐵路、鋪設電網(wǎng)”,這樣看似“重資產(chǎn)、硬科技”的路徑,表面顯得笨重,內(nèi)在則是在規(guī)模效應作用上去打造自身難以撼動的競爭壁壘。
2025 亞馬遜云科技re:Invent 中國行即將啟幕:12月18日開始,北京、上海、深圳、成都四城線下巡演及線上專場將同步開啟,無論你是云計算新手還是技術(shù)老兵,都將從高階演講、實戰(zhàn)內(nèi)容、技術(shù)分享和專家互動中受益。點擊【閱讀原文】立即注冊,搶占席位,把握Agentic AI時代的新機遇!
--THE END--
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.