亞馬遜云科技，如何拒絕讓Agent淪為玩具？

2025-12-05 21:39:04　來源: 銀杏科技

北京舉報

分享至

“Why not？”

在號稱“云計算”春晚的2025年亞馬遜云科技re:Invent大會上，亞馬遜云科技CEO Matt Garman演講中就拋出一連串問題：“為什么開發(fā)者不能專注于構(gòu)建而非基礎(chǔ)設施？為什么實驗時間與成本不能趨近于零？為什么不能讓每一個想法都成為可能？”

事實上，Matt Garman以上提問，都直指近年AI Agent火熱浪潮中，一直困擾企業(yè)群體如何真正釋放生產(chǎn)力的核心命題。歷年來，全球企業(yè)核心訴求需求沒有根本改變，本質(zhì)仍在于提高效率（SaveTime）。這也是多年來，亞馬遜云科技這家業(yè)務規(guī)模已達1320億美元的全球云巨頭一直聚焦的工作。

Agentic AI時代，AI Agent不是手段也不是目的，而成為生產(chǎn)力本身，不過前提還在于，需要讓Agent安全合理地落地并實現(xiàn)高效運轉(zhuǎn)。亞馬遜云科技 CEO Matt Garman 在 Keynote 上就談到：“Put Agent into Work。”

事實上，過去數(shù)年AI正在從Copilot向Autopilot加速轉(zhuǎn)化過程中，不少企業(yè)已經(jīng)為“聊天機器人”支付了昂貴的學費，然而實際操作下來，卻發(fā)現(xiàn)輔助式、被動化的問答模式，很難真正讓公司實現(xiàn)業(yè)績實質(zhì)性增長。因此，Matt Garman強調(diào)的“Put Agent into Work”，或許也指向了AI核心定位的變化，即從一種“咨詢顧問”轉(zhuǎn)變?yōu)椤皵?shù)字工人”，需要以一種工作更加主動、細節(jié)更加精準、安全更加可控的行為模式，為企業(yè)切實創(chuàng)造價值。

如果細看2025年re:Invent大會上關(guān)鍵人物的發(fā)言傾向，不難發(fā)現(xiàn)，從亞馬遜云科技首席執(zhí)行官Matt Garman到亞馬遜云科技Agentic AI副總裁Swami Sivasubramanian，再到亞馬遜云科技高級副總裁Peter DeSantis，均用了大量篇幅講述AI Agent究竟如何有序、有效、有用地落地。

“未來數(shù)十億Agent將滲透各行各業(yè)，助力企業(yè)實現(xiàn)10倍效率躍遷。”Matt Garman在開篇演講中激昂談到。

值得注意的是，近二十年來亞馬遜云科技一直通過推動云計算和生成式AI普及在各行各業(yè)“搭臺唱戲”，成為全球企業(yè)群中效能放大器的典范，“利他戰(zhàn)略”也讓企業(yè)實現(xiàn)了二次成長，僅僅在過去一年，亞馬遜云科技新增營收就達220億美元。

一、利他思維如何更好地“搭臺唱戲”

沒有一個真正的戰(zhàn)略家是對戰(zhàn)術(shù)細節(jié)不熟悉的，一個真正的戰(zhàn)略家也不會將戰(zhàn)略眼界聚焦短期勝敗上。

亞馬遜科技2025年re:Invent大會首日，公司CEO Matt Garman兩個多小時主題演講聚焦與發(fā)散并進，實際上也是以上定論的集中反映。

一方面，Matt Garman全場兩個多小時的Keynote就發(fā)布新品接近40個，集中展現(xiàn)了亞馬遜云全新一代自研芯片、前沿基礎(chǔ)模型及企業(yè)級模型定制框架等一系列重磅產(chǎn)品，在算力層、模型層和應用層持續(xù)突破，令人有一種應接不暇的感覺。

另一方面，Matt Garman的絕大多數(shù)時間，實際聚焦在了AI基礎(chǔ)設施和全新Agent產(chǎn)品的講解上。對此，Matt Garman直截了當?shù)刂赋觯骸癆I Agent正在把我們帶到AI發(fā)展的關(guān)鍵拐點。未來每家公司，每一個可以想象的領(lǐng)域中都會運行數(shù)十億個Agent！”

什么讓亞馬遜云科技有了這樣的判斷？這與近些行業(yè)在AI浪潮中所處的一個尷尬境遇密不可分：僅從目前來看，AI浪潮助力下的企業(yè)仍無法實現(xiàn)投入產(chǎn)出比的均衡，巨額投入什么時候才能轉(zhuǎn)化為企業(yè)實實在在的業(yè)績反映，也成為困擾眾多企業(yè)CEO的難題。

為了破局，為了讓AI從Assistant加速質(zhì)變成能主動干活、充分釋放生產(chǎn)力的Agent，并且讓Agent更可信、更好用、更可控、成本更低，亞馬遜云開出了自己完整的解決方案，即算力基礎(chǔ)設施、推理平臺、數(shù)據(jù)、還有實現(xiàn)Agent 的一系列工具鏈。

貫穿亞馬遜云科技以上解決方案的核心思路則在于，向下自研芯片，以性價比夯實算力底座，中間擴充模型，提供給客戶更多、更厚的選擇，向上則樹立規(guī)則，嚴格把控Agent實際操作風險，從而真正達成一整套可用、可信、可控的技術(shù)閉環(huán)。

比如說，當下Agent對Token消耗量，已經(jīng)達到了較為簡單AI對話的十倍以上。為此，如何更直接地降低Token成本，為企業(yè)提供性價比算力基礎(chǔ)設施配套，就成為亞馬遜云科技的一大發(fā)力點。

在備受期待的算力基礎(chǔ)設施構(gòu)建上，亞馬遜云科技一方面作為運行NVIDIA GPU的核心場所之一，積累了大規(guī)模的GPU運行經(jīng)驗，由此，本次大會公司例舉P6e GB200 超級服務器就相比上一代 P5e，計算性能提升超過20 倍。

此外，亞馬遜云科技始終沒有減緩自身底層芯片布局。本次大會上，Matt Garman宣布正式推出了最新Trainium3，并且發(fā)布Amazon Trainium3 UltraServers，這也成為亞馬遜云科技首款搭載3納米工藝AI芯片的服務器。

相較Amazon Trainium2，不僅計算能力提升4.4倍、內(nèi)存帶寬提升3.9倍，每兆瓦算力可處理的AI token數(shù)量達成了5倍增長，為大規(guī)模 AI 訓練與推理帶來顯著的效率與能效優(yōu)勢。并且，新一代服務器在運行OpenAI的GPT-OSS-120B模型時，每兆瓦輸出token數(shù)是Amazon Trainium2的5倍以上，可實現(xiàn)更極致的能耗比。

大會上，Matt Garman還首次披露了Amazon Trainium4芯片，承諾將實現(xiàn)較Amazon Trainium3 UltraServers六倍的FP4計算性能、四倍內(nèi)存帶寬和兩倍高內(nèi)存容量，繼續(xù)堅守亞馬遜云科技在AI芯片領(lǐng)域的長期投入的戰(zhàn)略定力。

值得注意的是，基礎(chǔ)算力的底座夯實上亞馬遜云科技常年持續(xù)投入，如今已完成超100萬個Amazon Trainium2芯片規(guī)模化部署，為Amazon Bedrock中大部分推理工作提供了穩(wěn)定可靠的算力支持，并且已為公司帶來了幾十億美元可觀收入。

某種程度上說，也正式由于亞馬遜云科技對自研芯片持續(xù)的投入，也讓公司在當下越發(fā)復雜的競爭環(huán)境中擁有了更多主動權(quán)。尤其是在算力即權(quán)力的當下，一旦企業(yè)的核心利潤被上游硬件廠商大幅拿走，那么云廠商在博弈中占據(jù)主動。

從這點上說，亞馬遜云科技自研芯片構(gòu)建發(fā)力點不僅僅是技術(shù)壁壘，更是一種構(gòu)建自身UE的必然：尤其是當Agent時代來臨，Token消耗量呈現(xiàn)出指數(shù)級增長時，要想實現(xiàn)商業(yè)更長久健康的盈利，基礎(chǔ)算力上的“自研”與“降本”必不可少。

除了算力，第三方模型引用上Amazon Bedrock也持續(xù)豐富著客戶模型選擇權(quán)，在“利他戰(zhàn)略”下持續(xù)開源、繼續(xù)“搭臺唱戲”。大會現(xiàn)場，亞馬遜云科技展現(xiàn)出一種更為開放姿態(tài)，Matt Garman則向世人宣布，公司收錄了更多開源、通用、專用等多種類型的模型。其中，Amazon Bedrock就收錄了包括谷歌的 Gemma、NVIDIA的Nemotron，Kimi和Minimax 廠商的最新模型，真正為亞馬遜云科技的客戶提供了模型運用上更廣闊的空間。

與此同時，亞馬遜云科技也在讓自身大模型繼續(xù)進化，大會現(xiàn)場同步了Amazon Nova迭代到了Amazon Nova 2的最新進展。該大模型包含Amazon Nova 2 Lite、Amazon Nova 2 Pro、Amazon Nova 2 Sonic、Amazon 2 Omni四個版本可供客戶在不同場景中調(diào)用，延續(xù)了強大智能能力同時，也持續(xù)將成本效率與低延遲表現(xiàn)大幅提升。

并且，Amazon Nova 2實際測試中各個版本性能表現(xiàn)也都可圈可點。例如，Amazon Nova 2 Lite 性能就可比肩 GPT-5 Mini、Claude Haiku 4.5等業(yè)界先鋒模型。此外，Amazon Nova 2 Pro 在指令遵循、Agentic工具使用等基準上超越 GPT-5.1、Gemini 3 Pro Preview 以及 Claude Sonnet 4.5，進步顯著。

而在數(shù)據(jù)層面， Amazon AI Factories的推出，則更能反映公司的“利他戰(zhàn)略”：對于某些特殊客戶來說，數(shù)據(jù)處境與安全始終擺在第一性，為此，Amazon AI Factories一經(jīng)推出，就可將全套的 AI 算力集群、網(wǎng)絡架構(gòu)、存儲設施，直接打包運到客戶的本地數(shù)據(jù)中心里，實現(xiàn)了安全與算力的平衡統(tǒng)一。

事實上，Amazon AI Factories的推出，也在某種程度上揭示了一種云計算敘事邏輯的改變：過去多年，企業(yè)大趨勢是“上云”，可到AI時代后，由于數(shù)據(jù)主權(quán)、隱私和安全問題左右，如何讓“云下來”，則成為一種維護數(shù)據(jù)資產(chǎn)的必然選擇。

二、怎么讓Agent可信、可靠、可用？

除了基礎(chǔ)算力與模型擴展，亞馬遜云科技2025 re:Invent大會上，還創(chuàng)造性提出了如何幫助客戶“調(diào)教”出一個可控、可用、可信的Agent。某種程度上說，以上技術(shù)路線上展現(xiàn)的切實性，也是亞馬遜云科技核心競爭力的一種外化。

例如，當大多數(shù)平臺還在比拼Agent框架靈活性、推理速度時，亞馬遜云科技則更為敏銳又貼切地意識到，或許企業(yè)需要的不是一個能聊天的機器人，而是一個能干活的員工。

為此，亞馬遜云科技圍繞如何讓Agent安全合理地高效落地，去解決企業(yè)種種核心痛點，大會上就推出了Agentic AI平臺Amazon Bedrock AgentCore。在該平臺“約束”下，Agent 的日常使用、行為秩序得到了更好的秩序，由此公司則可大規(guī)模地安全構(gòu)建、部署和運行高性能的Agent。

為了確保Agent運行過程中的安全性與合規(guī)性，亞馬遜云科技則開放了AgentCore Policy、AgentCore Evaluations 功能。此舉的啟迪意義，或許不止于幫助客戶規(guī)避失序風險，更在于亞馬遜云科技嘗試著定義出Agent時代下一種全新的治理范式。

這已經(jīng)不是一種簡單的程序約束，而是給Agent制定出了一套行事準則，甚至說“法律法規(guī)”。由此一來，用戶在Agent運行過程中，就可以從人類行事的邏輯去規(guī)勸、約束AI，只有這樣，企業(yè)的更多核心業(yè)務或許才會讓Agent落地產(chǎn)生可能。

這也觸及到了Agent大規(guī)模落地的真正痛點。某種程度上說，大模型有一定概率性，可回到企業(yè)業(yè)務流程中，尤其涉及到財務層面，需要的必須是100%的確定性。事實上，企業(yè)群體頭疼的往往不是AI不夠聰明，而是AI“一本正經(jīng)地胡說八道”或“違規(guī)”越權(quán)操作。從這點上說，Amazon Bedrock AgentCore的核心價值或許就在于，給相對不可控的Agent加上確定性“枷鎖”后，很多風險將會被隔絕。

事實上，Agent興起的潮流下，圍繞“風險”衍生出大量核心的討論：比如在企業(yè)核心業(yè)務的使用場景下，一個不可控的Agent會展現(xiàn)出如何巨大的破壞力？這樣的猜想在不少科幻電影中已經(jīng)出現(xiàn)了大量發(fā)人深省的故事。

正因如此，除了Amazon Bedrock AgentCore，如何更快、更安全地將Agent加入到日常工作中來，亞馬遜云科技也提出自己一系列方案。比如，Amazon Quick 作為一款面向企業(yè)的智能 Agent 應用，不僅能夠幫助用戶進行深度分析、數(shù)據(jù)可視化和工作流自動化，還可以通過企業(yè)級的安全與隱私標準確保信息的可靠性與合規(guī)性。

除此之外，在備受關(guān)注的AI 編程領(lǐng)域，亞馬遜云科技在大會現(xiàn)場，也提出了三大Agent——比如，Kiro autonomous agent，可以作為虛擬開發(fā)者，持續(xù)分擔人類工作，并且能夠獨立完成各項任務，并在工作中持續(xù)學習拓展能力邊界。再比如，Amazon Security Agent則可以承擔虛擬安全工程師的角色，在應用設計、代碼審查與滲透測試等環(huán)節(jié)充當起企業(yè)的安全顧問，極大降低安全風險。還有可以幫助開發(fā)者，尤其是負責值班的工程師，主動發(fā)現(xiàn)系統(tǒng)故障或潛在缺陷的Amazon DevOps Agent。

從這點上說，鑒于亞馬遜云科技在服務行業(yè)二十年來積累的大量經(jīng)驗，無疑不在證明，各行各業(yè)、不同規(guī)模的組織面臨的需求痛點，都讓這家企業(yè)能在第一時間準確捕捉，由此根據(jù)企業(yè)現(xiàn)實存在的痛點。

并且，此次大會基于底層算力、推理平臺、數(shù)據(jù)再到Agent產(chǎn)品鏈路，亞馬遜云科技在今年 re:Invent 上展現(xiàn)出的，或許是自身一步步地把早期具有“玩樂”屬性、技術(shù)噱頭的Agent ，由此正式推向商業(yè)實戰(zhàn)中。

三、在Agent時代，找回丟失的創(chuàng)造力

過去兩年，我們無不見證了大模型帶來的顛覆，同時也看到了其呈現(xiàn)的局限性。

比如，大模型或許能寫詩作畫，卻很難替用戶解決更多實際問題，比如買一張機票：從這點上說，Agent與傳統(tǒng)大模型助手的核心區(qū)隔，或許就在于分自主行動力。

在這一視角下，Agent需要擔負起的責任，則更加精細化，是一個能夠主動執(zhí)行任務、在復雜環(huán)境中實現(xiàn)動態(tài)推理、并讓工作流程自動化的“數(shù)字員工”，也是一種未來生產(chǎn)力的集中釋放。

亞馬遜云科技2025 re:Invent 大會上，亞馬遜云科技Agentic AI高級副總裁Swami Sivasubramanian的Keynote上，就圍繞Agent如何重塑商業(yè)世界的可能展開了核心推論。

比如，AI Agent 如何才能實現(xiàn)真正的大規(guī)模生產(chǎn)落地，從而將概念性變?yōu)檎媲械纳a(chǎn)力提升？

Swami Sivasubramanian的Keynote上提到了一個生動案例：當我們最早寫下第一行代碼時是怎樣的感覺？這樣一種類似造物者、仿佛能做到任何事的創(chuàng)作自由，在Agent 時代又該如何找回？

事實上，以往用戶無拘無束、無所不能的創(chuàng)作欲表現(xiàn)，到了現(xiàn)在，卻隨著 AI 系統(tǒng)的日益復雜，變得更加難以實現(xiàn)：尤其是那些概念驗證階段看似表現(xiàn)良好的AI，一旦進入大規(guī)模應用，卻往往因為邏輯脆弱、缺乏模塊化，從而對用戶想象力、生產(chǎn)力的激發(fā)產(chǎn)生了一種反作用。

為了解決以上痛點，亞馬遜云科技則將發(fā)力點聚焦到了“簡潔性”上。比如，一個Agent往往由基礎(chǔ)模型、代碼和工具三大組件構(gòu)成，協(xié)同編排這些組件往往比較繁瑣，為此，亞馬遜云科技則發(fā)布并開源了Amazon Strands Agents SDK。

這一框架也被引入了TypeScript 平臺，今后，開發(fā)者則能夠利用熟悉的工具棧構(gòu)建完整出Agent 堆棧。更關(guān)鍵的是，Strands 還新增了對邊緣設備的支持。這意味著，未來Agent將不再局限于云端服務器，而是可以運行在汽車、游戲機甚至機器人終端上。值得注意的是，短短數(shù)月，該SDK 下載量突破 500 萬次，再次證明了開發(fā)者對“簡潔性”的青睞。

另一個制約生產(chǎn)力解放的直接命題，也被Swami關(guān)注到了。比如，為了解決當下AI普遍存在的“健忘癥”、即無法在長期交互中沉淀經(jīng)驗，Amazon Bedrock AgentCore Memory推出后，則接入了全新的情景式記憶功能，能夠讓Agent從過往的上下文、推理過程、操作結(jié)果中持續(xù)學習，并將這些信息應用于后續(xù)交互。

在幫助Agent解決了“聰明”的能力后，亞馬遜云科技也對其效率提升，集中下手。Swami 更是直言：“效率關(guān)乎成本、規(guī)模與敏捷性。”

事實上，盡管通用的基礎(chǔ)模型雖然“智商高”，但在處理特定任務時，往往伴隨著高昂的成本和延遲。由此，企業(yè)特定使用場景中，“小而美”的高質(zhì)量定制模型已漸成主流。

這也是AI開發(fā)模式一種必然的“祛魅”過程。以往，行業(yè)迷信“參數(shù)至上”，不過，Swami的觀點則強調(diào)專用性一定程度、一定場景下，無疑將會優(yōu)于通用性。類似一家企業(yè)不需要一個樣樣稀松的通才，相反，去打造成百上千個精通業(yè)務細節(jié)的專才，或許才能真正釋放生產(chǎn)力。

基于此，亞馬遜云科技也打出了一套組合拳。比如，RFT可讓定制模型的準確率相比基礎(chǔ)模型提升 66%。再加上Amazon Nova Forge開創(chuàng)了“開放式訓練”的先河，允許企業(yè)在訓練各階段注入專有數(shù)據(jù)，讓模型不僅懂通用知識，更懂企業(yè)的“行話”。

以上這一切，也讓定制化實現(xiàn)效率大幅提升成為一種未來的趨勢。并且，在讓Agent變得更聰明、更具效率的同時，如何確保成百上千個Agent 被部署在生產(chǎn)鏈條的風險把控，也成為了一大重點。

對此，Swami則進一步將失序把控的解決方案細化給出。除了先前介紹的Amazon Bedrock AgentCore，為了進一步提升可靠性，亞馬遜云科技還推出Amazon Nova Act。這是一套用于構(gòu)建可靠 UI 工作流程的全新服務，由定制版的 Amazon Nova 2 Lite 模型驅(qū)動。它結(jié)合了自動推理（Automated Reasoning）的數(shù)學邏輯驗證，在早期測試中實現(xiàn)了高達 90%的可靠性。

甚至，在現(xiàn)場演示的“反電詐”場景中，Agent 不僅能檢查信用卡交易、合理提出懷疑，甚至能收集證據(jù)并協(xié)助報警。這種基于邏輯驗證的嚴謹性，讓“人機信任”不再是一句空話。

四、一條實實在在的道路

大會最后一天，亞馬遜云科技發(fā)布了自身迄今為止性能最強、能效最高的Amazon Graviton5處理器。與上一代相比，基于Graviton5的全新EC2 M9g實例性能提升高達25%，實現(xiàn)了單封裝 192 核心的突破，并將 L3 緩存提升了 5 倍。一個直觀的使用案例是，Apple在遷移核心服務后，實現(xiàn)了成本降低 30%、性能提升 40%的不錯效益。

值得注意的是，目前亞馬遜云科技新增CPU容量中連續(xù)第三年有超半數(shù)由Graviton驅(qū)動，EC2頭部1000家客戶中已有98%受益于其顯著的性價比優(yōu)勢，包括Adobe、Airbnb、Atlassian、Epic Games、Formula 1等。

不僅如此，在亞馬遜云科技re:Invent 2025 最終日，公司從Amazon Graviton5 和Amazon Trainium3 UltraServers的極致能效展示，到Amazon S3 Vectors和Amazon Lambda Managed Instances重新定義了數(shù)據(jù)和無服務器的邊界，并最終通過Project Mantle的系統(tǒng)級創(chuàng)新，再次完整地收束了過去數(shù)天公司想要強調(diào)的AI時代核心理念。

事實上，亞馬遜云科技2025 re:Invent 大會臨近尾聲時，公司則用大量基礎(chǔ)設施產(chǎn)品的密集發(fā)布，重申了一個公司發(fā)展的核心命題：即AI不會顛覆基礎(chǔ)設施，反而會讓基礎(chǔ)設施的安全性、成本和敏捷性等變得更加顯著。

從這點上說，再次回顧亞馬遜云科技2025年re:Invent大會，真正留下的或許不是一串令人眼花繚亂的產(chǎn)品清單，而是一張清晰、實用、貼切的企業(yè)發(fā)展藍圖。

從Nitro到Graviton再到Trainium的完整自研芯片堆棧，以及Apple、Anthropic等重量級客戶背書，亞馬遜云科技的企業(yè)競爭力壁壘中，一直有特殊且務實的底座：即當其他云廠商仍在試圖證明自身“能做 AI”時，亞馬遜云科技則已經(jīng)將視野聚焦到了用“安全性、可用性、成本可控”等，能直達商業(yè)核心的解決辦法，再次證明了自己在AI規(guī)模化、可持續(xù)發(fā)展、盈利實現(xiàn)等方面，于行業(yè)內(nèi)扮演了一個重要且不可或缺的角色。

值得注意的是，大會最后一天，亞馬遜CTO Dr. Werner Vogels也完成了他在re:Invent的最后一場主題演講，并談到：AI不會取代開發(fā)者，但停止進化的開發(fā)者則會被時代淘汰。

從這點上說，亞馬遜云科技在AI 的聚光燈下，或許選擇了一條最不性感、最不顯眼的道路。從過去到未來，亞馬遜云科技始終在做的事情，核心仍在于為AI時代去“修筑鐵路、鋪設電網(wǎng)”，這樣看似“重資產(chǎn)、硬科技”的路徑，表面顯得笨重，內(nèi)在則是在規(guī)模效應作用上去打造自身難以撼動的競爭壁壘。

2025 亞馬遜云科技re:Invent 中國行即將啟幕：12月18日開始，北京、上海、深圳、成都四城線下巡演及線上專場將同步開啟，無論你是云計算新手還是技術(shù)老兵，都將從高階演講、實戰(zhàn)內(nèi)容、技術(shù)分享和專家互動中受益。點擊【閱讀原文】立即注冊，搶占席位，把握Agentic AI時代的新機遇！

--THE END--

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.