大部分AI技術(shù)棧都在解決一個錯誤的問題。人們盯著模型質(zhì)量不放,卻忽視了一個更隱蔽的瓶頸:模型用來回答問題的那個世界,停在了一年半以前。最新的技術(shù)浪潮——具備實時網(wǎng)絡(luò)訪問權(quán)限的托管代理運行時——正是為了縫合這道信息保鮮期的裂縫。
AWS剛剛在Amazon Bedrock AgentCore上發(fā)布了Web搜索功能,一項托管工具,讓代理程序能夠在同一套處理記憶、身份和代碼執(zhí)行的運行時里,從開放網(wǎng)絡(luò)拉取實時的最新信息。此事之所以緊迫,是因為模型的訓(xùn)練截止日期與當(dāng)下之間的空白地帶,正是幾乎所有生產(chǎn)級代理悄悄失效的地方。不是轟轟烈烈地崩潰,而是悄悄地,用一種自信的口吻,描述一個不復(fù)存在的世界。
![]()
讀完這篇指南,你會理解其中的架構(gòu)邏輯、成本計算方式,以及如何在不自己搭建搜索基礎(chǔ)設(shè)施的前提下,交付一個實時的代理系統(tǒng)。
核心論點可以用兩句話講清楚:一個六步代理流水線,每一步的可靠性做到97%,端到端的可靠性只剩下83%左右——而最常失敗的那一步,正好是拿著過時數(shù)據(jù)自信作答的環(huán)節(jié)。AWS AgentCore Web搜索以托管工具的形式,把這道時間裂縫填上了。這意味著,你花了兩個月搭建的自建搜索管線,剛成了遺留設(shè)施。
這組“97%到83%”的推算是基于生產(chǎn)審計得出的估算,與多代理可靠性研究里的誤差累積計算吻合——把0.97連乘六次,得到的數(shù)字就在0.83附近。大多數(shù)公司是在系統(tǒng)上線后才發(fā)現(xiàn)這個問題的,而不管什么時候復(fù)盤,幾乎總能找到這樣一個失敗的環(huán)節(jié):代理對一條已經(jīng)失效的信息信誓旦旦。
過去兩年間,為維護代理程序的時效性,主流做法是在私有向量數(shù)據(jù)庫上疊加檢索增強生成。這套方法對付你自己的文檔很好用,但對于“今早市場發(fā)生了什么”“現(xiàn)在的報價是多少”“這項規(guī)定上周改過沒有”這類問題,它使不上勁。開放網(wǎng)絡(luò)是最寬廣、最鮮活的公共信息來源,但絕大多數(shù)代理一直被擋在防火墻之內(nèi),因為要在生產(chǎn)級規(guī)模上接入搜索——處理速率限制、排序、內(nèi)容提取、合規(guī)、延遲——確實很難。不少團隊在寫下一行代理邏輯之前,單單在這套管道搭建上就耗費了兩個月以上的時間。Amazon Bedrock AgentCore Web搜索把這些工作壓縮進了一個托管工具里。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.