網易首頁 > 網易號 > 正文申請入駐

從 Prompt 到 Context：易點天下 Agentic AI 工程化實踐

2026-05-08 15:37:25　來源: InfoQ

北京舉報

分享至

作者 | 何宇航

隨著 2026 年的到來，生成式 AI 已經徹底告別了"Demo 滿天飛"的狂熱期，正式步入工程化落地的深水區。當大模型的能力邊界不再神秘，企業架構師們面臨的核心命題已經發生轉移：如何在一個確定性要求極高的復雜企業架構中，有效馴服 Agent 固有的"幻覺"與"遺忘"，讓概率性的智能穩定地跑在確定性的生產系統之上？

在 2026 QCon 全球軟件開發大會·北京站上，易點天下中臺研發總監何宇航分享了其在 Agentic AI 領域的工程化實踐與思考。依托企業級"上下文工程（Context Engineering）"與縱深安全防御體系，他詳細解讀了易點天下如何將概率性的 AI 穩妥地嵌入全球化業務的毛細血管中。

1 底層支撐：多云共生的確定性架構

Agent 的穩定運行無法脫離堅實的基礎設施。易點天下的核心業務覆蓋全球 230 多個國家和地區，面對極高的合規與網絡連通性挑戰，其底層的 Cycor 平臺從設計之初便確立了多云戰略（Multi-cloud）。

目前，該平臺已實現對 AWS、GCP、阿里云、騰訊云、華為云等主流廠商的無縫接入與統一資源調度，實際納管著大量 K8s 集群與底層組件，形成了跨云、跨地域的統一控制面。

在 Agent 的構建邏輯中，這種不依賴單一云底座的多云共生架構具有極高的戰略價值：它不僅從根本上規避了供應商鎖定（Vendor Lock-in）的風險，更重要的是在面對大模型算力調度時，能夠在成本、效果與可控性之間動態平衡。對于人力相對精簡的底層運維團隊而言，這種高度統一的多云調度能力，正是后續構建 DevOps Agent 的物理前提。

2 技術攻堅：從 Prompt 編排走向 Context Engineering

在 Agent 探索的早期（V1 階段），研發團隊曾基于低代碼平臺構建線性 Workflow 編排：由一個前置分類器根據 System Prompt 路由到不同的固定 Agent。系統運行三個月后，架構陣痛集中暴露：

首先，高度依賴系統提示詞的分類器極不穩定，分類錯誤率長期維持在 15% 左右，團隊常常陷入"修復 A 場景卻破壞 B 場景"的窘境；其次，記憶僅局限于單次上下文窗口，缺乏跨會話的持久化能力，導致同一故障在不同會話中被反復從零推理；最后，固定編排使各 Agent 各自為戰，無法協同處理跨域鏈路問題。

為此，技術團隊果斷放棄線性編排，轉向基于 Agent Loop 的自主智能體架構（單輪對話內最多 15 輪工具調用循環），并將工程重心從"怎么措辭（Prompt）"徹底切換到"每一步該給什么信息（Context）"的上下文工程。

簡單來說，上下文工程解決三個彼此糾纏的根本問題：需要的信息如何進得來、無關的信息如何擋得住、寶貴的 Token 預算如何花在刀刃上。圍繞這三條主線，易點天下搭建了一套覆蓋"分層記憶 + 主動注入 + 預算治理 + 壓縮續接"的完整工程體系。

1. 構建六層上下文體系

為了讓 Agent 在長期任務中既能記住關鍵線索，又能有效過濾噪音，系統設計了一條動態的信息管線，將上下文精細化為六個層次：

L1 Session Memory（當前會話）：基于 PostgreSQL 普通表，通過 session_id 進行硬隔離，支撐當前會話的毫秒級讀寫與自動化清理；
L2 Short-Term（近期記憶）：維持 24 小時的跨會話時間窗口，用于識別短期內的故障復發；
L3 Long-Term（持久化事實）：引入記憶引擎與向量存儲，將高價值對話提煉為客觀事實并持久化，配合 Agentic Search 進行語義檢索與沖突合并；
L4 Knowledge Graph（實體關系）：由 LLM 抽取三元組，存入圖數據庫，幫助 Agent 在復雜微服務網絡中建立資源間的拓撲認知；
L5 Experience（個人經驗庫）：系統自動對高頻故障模式進行聚類，提煉出如"遇到 OOM 先查 limits"的經驗標簽，在同類報錯中自動注入；
L6 Skill（組織技能手冊）：由經過人工驗證的經驗固化而來的標準化 Markdown 手冊，作為組織級的 Skill 資產沉淀下來，真正實現"個人經驗 → 團隊資產"的躍遷。

2. 主動注入：讓 Agent 在"需要的時候剛好知道"

僅僅把信息存下來還遠遠不夠。傳統的"Agent 按需自取"模式存在一個根本缺陷——模型不知道自己不知道什么，它無法主動去檢索一條它從未聽說過的故障記錄。為此，易點天下借鑒了 Hook 化的主動推送思路，在 Agent 生命周期的關鍵節點內置了三類檢索鉤子：

UserMessage 鉤子：在用戶提問進入 Agent Loop 之前，先做意圖過濾與關鍵詞 / 語義雙路召回，將相關記憶分層注入到 System Prompt；
PreToolUse 鉤子：在寫文件、改配置等敏感工具調用之前，按精確資源 ID 匹配歷史變更記錄與已知風險，避免 Agent 重復踩坑；
ErrorSignal 鉤子：一旦檢測到錯誤關鍵字（timeout、OOM、ImagePullBackOff 等），自動按 bugs/errors 維度拉取歷史解法并分層注入。

這一機制把"記憶"從被動的資料庫升級為主動的副駕駛——Agent 在真正需要某條知識之前，相關上下文就已經悄悄到位。

3. Token 預算治理：漸進式注入與分層內容

上下文窗口是 Agent 時代最稀缺的資源。經驗表明，一次粗放地塞入 3 條知識、每條 500 tokens，就會吞掉約 10% 的可用窗口，不僅擠占推理空間，還會放大 Lost in the Middle 效應。易點天下為此構建了一套分層的 Token 預算治理體系：

三級內容分層：每條知識都會被預先生成 L0/L1/L2 三種"分辨率"——L0 Abstract 約 100 tokens 的一句話摘要，L1 Overview 約 300 tokens 的詳細要點，L2 Full 則是完整 Markdown 全文；
按相關度動態選檔：檢索命中后，相關度 score > 0.8 注入 L1、score ≤ 0.8 降級為 L0、用戶或 Agent 主動 Read 時才展開 L2，單次注入 Token 穩定壓在 100–300 的小窗口內；
短會話直通，長會話采樣：當整段會話字符數在預算之內時直通不壓縮，零信息損失；一旦超預算，優先截斷單條 assistantText，而不是整段丟棄問答對，保住推理鏈條的完整性；
硬預算 + 軟降級：每條鏈路都設有明確的性能預算（如 UserMessage 注入 3 秒、PreToolUse 注入 100 毫秒內完成），超時即走降級路徑，寧可少注入也不阻塞主流程。

這一套組合拳下來，單次注入的 Token 消耗下降約 80%，同時因為 L2 完整內容始終"一鍵可達"，信息完整性反而得到了更好的保證。

4. 漸進式工具加載，破解 Token 瓶頸

在真實的 K8s 運維場景中，Agent 面臨數十乃至上百個可選工具。如果將全部 Tool Schema 一次性塞入 Prompt，不僅浪費 Token，還會觸發大模型的中間注意力丟失（Lost in the Middle），導致工具選擇錯亂。

為此，易點天下設計了"漸進式工具加載（Deferred Tool Registry）"機制：初始態僅激活 list_pods 等核心工具，其余長尾工具僅在 Prompt 中保留極簡描述；當模型推理需要時，通過內部的 tool_search 能力按需動態喚醒并加載對應工具。

這一工程手段帶來了跨越式的效果提升：工具調用準確率由 V1 的約 70% 提升至 V2 的約 90%；由于記憶層可直接命中已解決過的故障模式，重復性問題的處理時間由原先的 60 秒量級縮短至 5 秒以內，響應周期實現了數量級改善。

5. 壓縮續接：讓長任務不"失憶"

即便做了嚴格的預算治理，真實運維場景下的長鏈路排障仍可能逼近上下文上限。為此，系統在窗口接近閾值時會觸發 PreCompact 鉤子：將既有對話按"問題—行動—觀察—結論"的結構化摘要格式進行壓縮，生成 { overview, steps, todos } 三段式的會話摘要，并在下一輪啟動時作為 Warm 層（最近 10 次會話摘要，FIFO 淘汰）注入。這使得 Agent 即使跨越數小時的多階段任務，也能"記得上次做到哪一步、還有哪些 TODO 沒閉環"，徹底告別了 V1 階段"關掉對話就失憶"的窘境。

可以說，如果 L1–L6 回答的是信息放在哪里，主動注入解決的是什么時候送進去，那么 Token 預算治理與壓縮續接要回答的則是怎么在有限窗口里把每一個 Token 花在最有價值的地方——這三件事合在一起，才構成了易點天下真正意義上的"上下文工程"。

3 安全底線：五道防線確保可控性

將確定性要求極高的生產環境（如操作海量 K8s 集群）交由概率性的大模型去決策，安全是不可逾越的底線。在易點天下的治理理念中，"AI 是加速器，而不是剎車"——但加速器必須跑在有護欄的賽道上。

為此，系統在 Agent 操作鏈路上設計了五層結構化的縱深防御閘門。在這套體系中，僅有 1 層允許大模型（LLM）參與決策，其余 4 層全部交由嚴謹的規則代碼進行物理兜底：

白名單準入（NamespaceGuard）：在中間件代碼層面直接屏蔽 LLM 對 kube-system 等核心命名空間的可見性與操作權限，風險從源頭隔離；
試執行與人工介入（Dry Run + HITL）：LLM 生成的運維指令先進行空跑校驗，敏感操作強制觸發人工審批流（這是 LLM 唯一參與驗證判斷的層級）；
資源鎖與爆炸半徑限制：通過代碼硬編碼單次操作的資源配額與影響范圍，防止級聯雪崩；
規則校驗（不輕信 LLM）：指令執行后，系統拒絕依賴大模型的自然語言回復，而是通過代碼重新調用系統接口，對比實際狀態是否符合預期；
強制回滾機制：系統約束所有修改類工具在注冊時必須附帶降級與回滾邏輯，出現異常可一鍵退回安全態。

通過這套防御機制，易點天下將復雜集群操作的誤執行率壓低至接近于零，在效能與安全之間取得了穩定平衡。

4 未來洞察：生產力重構與開發者的新身份

在工程化落地的推動下，AI 的定位已經發生質變。正如其內部實踐總結中所提出的預判：在 2026 年的 AI Coding 時代，開發者的工作姿勢將被徹底重構——"由 AI 負責執行，人負責 Taste（審美與邏輯判斷）"。

目前，Agent 在易點天下早已突破底層運維實驗室的邊界，作為"數字搭子"深度滲透到業務毛細血管之中。依托堅實的 AI 中臺架構，公司內部已活躍運行著近百個不同職能的 Agent，覆蓋營銷業務（策略洞察、自動化投放）、內部運營（BI 分析、審批協同）、技術運維、客戶服務等多個維度。

當大模型基座逐漸趨同，真正的技術壁壘將建立在三件事之上：企業對上下文工程的理解深度、多云架構的掌控力，以及把組織經驗沉淀為可執行 Skill 的能力。易點天下的工程化實踐再一次證明：在這場生產力重構的浪潮中，用極客的確定性去駕馭 AI 的不確定性，是企業走向智能化的必由之路。

（注：文中提及的相關數據均來源于易點天下，最終解釋權歸易點天下所有。）

會議推薦

測完 MBTI，快來解鎖技術人專屬 AITI ！前沿探索家、大模型工程師、Agent 實戰拆解師、行業賦能師… 你是哪一種？6.26-27 # AICon 上海站等你面基同頻人！世界模型與多模態智能突破、Agent 架構與工程化實踐、Agent 安全與可信治理、企業級研發體系重構等 14 大專題全面開啟，誠摯邀請你登臺分享實戰經驗。AICon 2026，期待與你同行。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.