![]()
作者 | Steef-Jan Wiggers
譯者 | 明知山
Cloudflare 在 Agents Week 期間宣布 Agent Memory 已開啟私人測試。這是一項托管服務,可為 AI 智能體提供跨會話、上下文壓縮以及重啟后的持久化記憶能力。該服務無需把所有內容都塞進上下文窗口,而是從對話中提取結構化記憶,只在需要時檢索相關內容。Cloudflare 工程團隊的 Tyson Trautmann 與 Rob Sutter 撰文 表示:
我們之所以構建 Agent Memory,是因為平臺上實際運行的工作負載暴露出了現有方案無法徹底解決的短板。那些在真實代碼庫和生產系統中運行數周乃至數月的智能體需要一種能夠隨規模擴大持續可用的記憶能力,而不僅僅是在標準基準數據集上表現良好的記憶。
該服務解決了業界所說的上下文衰減(Context Rot)問題。即便上下文窗口已突破百萬級詞元,相關研究表明,隨著上下文不斷被填滿,模型輸出質量會隨之下降。開發者陷入兩難困境:要么保留全部信息,任由輸出質量下滑,要么大幅精簡內容,但會丟失智能體后續所需的關鍵信息。研究還表明,模型在上下文更少、但內容更相關的情況下能夠生成更優質的結果,這也讓記憶功能不再只是單純的存儲管理工具,更成為提升輸出質量的重要手段。
Cartesian 首席軟件架構師、InfoQ 編輯 Eran Stiller 在領英上 指出,此次公告標志著智能體系統設計思路正在發生更廣泛的轉變。“當一個智能體需要用到記憶的那一刻,你面對的就不再是聊天問題,而是架構問題。”Stiller 寫道。他認為記憶“越來越不像是模型的特新,更像是基礎設施”,生命周期管理、有效性校驗、信息壓縮與隔離邊界正成為重要的關注點。
對于從業者而言,架構細節至關重要。在數據攝入端,每條消息都會分配一個基于內容尋址的 SHA-256 標識,以此來實現冪等重復攝入。提取器會并行運行兩條處理通道:一條為寬泛通道,以約 10K 字符為單位進行分塊處理;另一條為細節通道,專注于名稱、價格、版本號等具體數值信息。驗證器會在記憶完成分類前執行八項校驗,將記憶劃分為四種類型:事實、事件、指令和任務。事實與指令按照歸一化主題進行鍵值管理,新增記憶會覆蓋舊有記憶,而非直接刪除舊記憶。
在檢索端,五條通道并行運行,并通過倒數排名融合(RRF)整合結果:全文搜索、精確事實鍵查找、原始消息搜索、直接向量搜索,以及通過生成聲明式答案來彌補詞匯不匹配問題的 HyDE 向量搜索。Cloudflare 默認使用 Llama 4 Scout(17B MoE)完成信息提取與分類工作,僅在內容合成時使用 Nemotron 3(120B MoE),發現更大的模型僅在合成階段能發揮作用。
![]()
Agent Memory 攝入流程圖,從對話輸入、驗證和分類,再到存儲
共享記憶功能是 Agent Memory 突破單智能體記憶局限的關鍵。記憶檔案不必專屬于某一個智能體,團隊可以共用同一份檔案,讓某位工程師的編碼智能體所學到的規范約定、架構決策和隱性知識都能供全員共享使用。Cloudflare 內部已經在落地這項功能。接入 Agent Memory 的智能體代碼審查器學會了在特定模式曾被標記且作者選擇保留的情況下自動保持靜默。
Kristopher Dunham 在 對這項服務的詳細評測 中指出了幾個值得權衡的取舍。關于供應商鎖定問題,Dunham 指出:
“可導出”意味著你能夠提取原始事實,但并不代表你的檢索流程具備可移植性。
他還觀察到,提取質量取決于開發者無法控制的次級模型,并建議對于關鍵事實主動調用 remember 工具,而非依賴自動攝入。對于準備采用智能體記憶服務的團隊,Dunham 建議先把對話歷史與習得事實做架構層面的拆分,并在上下文窗口達到約 60% 時觸發壓縮,而非等到達到上限。
智能體記憶賽道正變得愈發擁擠。Mem0 提供搭載向量、圖譜與鍵值存儲的托管云 API。Zep 的 Graphiti 引擎采用時序知識圖譜,用來追蹤各類事實的有效存續時間。LangMem 可與 LangGraph 集成,但需要自行部署托管。Letta(原 MemGPT)提供分層記憶架構,允許智能體自主管控自己的上下文。Cloudflare 這款產品的差異化優勢在于邊緣分布式部署、與自身計算原語(Durable Objects、Vectorize、Workers AI)的深度集成,以及獨有的多通道檢索架構。
Agent Memory 目前仍處于私人測試階段。在 Cloudflare 平臺上開發智能體的開發者可以 加入等待列表,產品定價暫未公布。
https://www.infoq.com/news/2026/04/cloudflare-agent-memory-beta/
聲明:本文由 InfoQ 翻譯,未經許可禁止轉載。
會議推薦
世界模型的下一個突破在哪?Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發體系不重構,還能撐多久?
AICon 上海站 2026,4 大核心專題等你來:世界模型與多模態智能突破、Agent 架構與工程化實踐、Agent 安全與可信治理、企業級研發體系重構。14 個專題全面開放征稿。
誠摯邀請你登臺分享實戰經驗。AICon 2026,期待與你同行。
今日薦文
你也「在看」嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.