![]()
作者 | 何宇航
隨著 2026 年的到來,生成式 AI 已經徹底告別了"Demo 滿天飛"的狂熱期,正式步入工程化落地的深水區。當大模型的能力邊界不再神秘,企業架構師們面臨的核心命題已經發生轉移:如何在一個確定性要求極高的復雜企業架構中,有效馴服 Agent 固有的"幻覺"與"遺忘",讓概率性的智能穩定地跑在確定性的生產系統之上?
在 2026 QCon 全球軟件開發大會·北京站上,易點天下中臺研發總監何宇航分享了其在 Agentic AI 領域的工程化實踐與思考。依托企業級"上下文工程(Context Engineering)"與縱深安全防御體系,他詳細解讀了易點天下如何將概率性的 AI 穩妥地嵌入全球化業務的毛細血管中。
1 底層支撐:多云共生的確定性架構
Agent 的穩定運行無法脫離堅實的基礎設施。易點天下的核心業務覆蓋全球 230 多個國家和地區,面對極高的合規與網絡連通性挑戰,其底層的 Cycor 平臺從設計之初便確立了多云戰略(Multi-cloud)。
目前,該平臺已實現對 AWS、GCP、阿里云、騰訊云、華為云等主流廠商的無縫接入與統一資源調度,實際納管著大量 K8s 集群與底層組件,形成了跨云、跨地域的統一控制面。
在 Agent 的構建邏輯中,這種不依賴單一云底座的多云共生架構具有極高的戰略價值:它不僅從根本上規避了供應商鎖定(Vendor Lock-in)的風險,更重要的是在面對大模型算力調度時,能夠在成本、效果與可控性之間動態平衡。對于人力相對精簡的底層運維團隊而言,這種高度統一的多云調度能力,正是后續構建 DevOps Agent 的物理前提。
2 技術攻堅:從 Prompt 編排走向 Context Engineering
在 Agent 探索的早期(V1 階段),研發團隊曾基于低代碼平臺構建線性 Workflow 編排:由一個前置分類器根據 System Prompt 路由到不同的固定 Agent。系統運行三個月后,架構陣痛集中暴露:
首先,高度依賴系統提示詞的分類器極不穩定,分類錯誤率長期維持在 15% 左右,團隊常常陷入"修復 A 場景卻破壞 B 場景"的窘境;其次,記憶僅局限于單次上下文窗口,缺乏跨會話的持久化能力,導致同一故障在不同會話中被反復從零推理;最后,固定編排使各 Agent 各自為戰,無法協同處理跨域鏈路問題。
為此,技術團隊果斷放棄線性編排,轉向基于 Agent Loop 的自主智能體架構(單輪對話內最多 15 輪工具調用循環),并將工程重心從"怎么措辭(Prompt)"徹底切換到"每一步該給什么信息(Context)"的上下文工程。
簡單來說,上下文工程解決三個彼此糾纏的根本問題:需要的信息如何進得來、無關的信息如何擋得住、寶貴的 Token 預算如何花在刀刃上。圍繞這三條主線,易點天下搭建了一套覆蓋"分層記憶 + 主動注入 + 預算治理 + 壓縮續接"的完整工程體系。
![]()
1. 構建六層上下文體系
為了讓 Agent 在長期任務中既能記住關鍵線索,又能有效過濾噪音,系統設計了一條動態的信息管線,將上下文精細化為六個層次:
L1 Session Memory(當前會話):基于 PostgreSQL 普通表,通過 session_id 進行硬隔離,支撐當前會話的毫秒級讀寫與自動化清理;
L2 Short-Term(近期記憶):維持 24 小時的跨會話時間窗口,用于識別短期內的故障復發;
L3 Long-Term(持久化事實):引入記憶引擎與向量存儲,將高價值對話提煉為客觀事實并持久化,配合 Agentic Search 進行語義檢索與沖突合并;
L4 Knowledge Graph(實體關系):由 LLM 抽取三元組,存入圖數據庫,幫助 Agent 在復雜微服務網絡中建立資源間的拓撲認知;
L5 Experience(個人經驗庫):系統自動對高頻故障模式進行聚類,提煉出如"遇到 OOM 先查 limits"的經驗標簽,在同類報錯中自動注入;
L6 Skill(組織技能手冊):由經過人工驗證的經驗固化而來的標準化 Markdown 手冊,作為組織級的 Skill 資產沉淀下來,真正實現"個人經驗 → 團隊資產"的躍遷。
2. 主動注入:讓 Agent 在"需要的時候剛好知道"
僅僅把信息存下來還遠遠不夠。傳統的"Agent 按需自取"模式存在一個根本缺陷——模型不知道自己不知道什么,它無法主動去檢索一條它從未聽說過的故障記錄。為此,易點天下借鑒了 Hook 化的主動推送思路,在 Agent 生命周期的關鍵節點內置了三類檢索鉤子:
UserMessage 鉤子:在用戶提問進入 Agent Loop 之前,先做意圖過濾與關鍵詞 / 語義雙路召回,將相關記憶分層注入到 System Prompt;
PreToolUse 鉤子:在寫文件、改配置等敏感工具調用之前,按精確資源 ID 匹配歷史變更記錄與已知風險,避免 Agent 重復踩坑;
ErrorSignal 鉤子:一旦檢測到錯誤關鍵字(timeout、OOM、ImagePullBackOff 等),自動按 bugs/errors 維度拉取歷史解法并分層注入。
這一機制把"記憶"從被動的資料庫升級為主動的副駕駛——Agent 在真正需要某條知識之前,相關上下文就已經悄悄到位。
3. Token 預算治理:漸進式注入與分層內容
上下文窗口是 Agent 時代最稀缺的資源。經驗表明,一次粗放地塞入 3 條知識、每條 500 tokens,就會吞掉約 10% 的可用窗口,不僅擠占推理空間,還會放大 Lost in the Middle 效應。易點天下為此構建了一套分層的 Token 預算治理體系:
三級內容分層:每條知識都會被預先生成 L0/L1/L2 三種"分辨率"——L0 Abstract 約 100 tokens 的一句話摘要,L1 Overview 約 300 tokens 的詳細要點,L2 Full 則是完整 Markdown 全文;
按相關度動態選檔:檢索命中后,相關度 score > 0.8 注入 L1、score ≤ 0.8 降級為 L0、用戶或 Agent 主動 Read 時才展開 L2,單次注入 Token 穩定壓在 100–300 的小窗口內;
短會話直通,長會話采樣:當整段會話字符數在預算之內時直通不壓縮,零信息損失;一旦超預算,優先截斷單條 assistantText,而不是整段丟棄問答對,保住推理鏈條的完整性;
硬預算 + 軟降級:每條鏈路都設有明確的性能預算(如 UserMessage 注入 3 秒、PreToolUse 注入 100 毫秒內完成),超時即走降級路徑,寧可少注入也不阻塞主流程。
這一套組合拳下來,單次注入的 Token 消耗下降約 80%,同時因為 L2 完整內容始終"一鍵可達",信息完整性反而得到了更好的保證。
4. 漸進式工具加載,破解 Token 瓶頸
在真實的 K8s 運維場景中,Agent 面臨數十乃至上百個可選工具。如果將全部 Tool Schema 一次性塞入 Prompt,不僅浪費 Token,還會觸發大模型的中間注意力丟失(Lost in the Middle),導致工具選擇錯亂。
為此,易點天下設計了"漸進式工具加載(Deferred Tool Registry)"機制:初始態僅激活 list_pods 等核心工具,其余長尾工具僅在 Prompt 中保留極簡描述;當模型推理需要時,通過內部的 tool_search 能力按需動態喚醒并加載對應工具。
這一工程手段帶來了跨越式的效果提升:工具調用準確率由 V1 的約 70% 提升至 V2 的約 90%;由于記憶層可直接命中已解決過的故障模式,重復性問題的處理時間由原先的 60 秒量級縮短至 5 秒以內,響應周期實現了數量級改善。
5. 壓縮續接:讓長任務不"失憶"
即便做了嚴格的預算治理,真實運維場景下的長鏈路排障仍可能逼近上下文上限。為此,系統在窗口接近閾值時會觸發 PreCompact 鉤子:將既有對話按"問題—行動—觀察—結論"的結構化摘要格式進行壓縮,生成 { overview, steps, todos } 三段式的會話摘要,并在下一輪啟動時作為 Warm 層(最近 10 次會話摘要,FIFO 淘汰)注入。這使得 Agent 即使跨越數小時的多階段任務,也能"記得上次做到哪一步、還有哪些 TODO 沒閉環",徹底告別了 V1 階段"關掉對話就失憶"的窘境。
可以說,如果 L1–L6 回答的是信息放在哪里,主動注入解決的是什么時候送進去,那么 Token 預算治理與壓縮續接要回答的則是怎么在有限窗口里把每一個 Token 花在最有價值的地方——這三件事合在一起,才構成了易點天下真正意義上的"上下文工程"。
3 安全底線:五道防線確保可控性
將確定性要求極高的生產環境(如操作海量 K8s 集群)交由概率性的大模型去決策,安全是不可逾越的底線。在易點天下的治理理念中,"AI 是加速器,而不是剎車"——但加速器必須跑在有護欄的賽道上。
為此,系統在 Agent 操作鏈路上設計了五層結構化的縱深防御閘門。在這套體系中,僅有 1 層允許大模型(LLM)參與決策,其余 4 層全部交由嚴謹的規則代碼進行物理兜底:
白名單準入(NamespaceGuard):在中間件代碼層面直接屏蔽 LLM 對 kube-system 等核心命名空間的可見性與操作權限,風險從源頭隔離;
試執行與人工介入(Dry Run + HITL):LLM 生成的運維指令先進行空跑校驗,敏感操作強制觸發人工審批流(這是 LLM 唯一參與驗證判斷的層級);
資源鎖與爆炸半徑限制:通過代碼硬編碼單次操作的資源配額與影響范圍,防止級聯雪崩;
規則校驗(不輕信 LLM):指令執行后,系統拒絕依賴大模型的自然語言回復,而是通過代碼重新調用系統接口,對比實際狀態是否符合預期;
強制回滾機制:系統約束所有修改類工具在注冊時必須附帶降級與回滾邏輯,出現異常可一鍵退回安全態。
通過這套防御機制,易點天下將復雜集群操作的誤執行率壓低至接近于零,在效能與安全之間取得了穩定平衡。
4 未來洞察:生產力重構與開發者的新身份
在工程化落地的推動下,AI 的定位已經發生質變。正如其內部實踐總結中所提出的預判:在 2026 年的 AI Coding 時代,開發者的工作姿勢將被徹底重構——"由 AI 負責執行,人負責 Taste(審美與邏輯判斷)"。
目前,Agent 在易點天下早已突破底層運維實驗室的邊界,作為"數字搭子"深度滲透到業務毛細血管之中。依托堅實的 AI 中臺架構,公司內部已活躍運行著近百個不同職能的 Agent,覆蓋營銷業務(策略洞察、自動化投放)、內部運營(BI 分析、審批協同)、技術運維、客戶服務等多個維度。
當大模型基座逐漸趨同,真正的技術壁壘將建立在三件事之上:企業對上下文工程的理解深度、多云架構的掌控力,以及把組織經驗沉淀為可執行 Skill 的能力。易點天下的工程化實踐再一次證明:在這場生產力重構的浪潮中,用極客的確定性去駕馭 AI 的不確定性,是企業走向智能化的必由之路。
(注:文中提及的相關數據均來源于易點天下,最終解釋權歸易點天下所有。)
會議推薦
測完 MBTI,快來解鎖技術人專屬 AITI !前沿探索家、大模型工程師、Agent 實戰拆解師、行業賦能師… 你是哪一種?6.26-27 # AICon 上海站等你面基同頻人!世界模型與多模態智能突破、Agent 架構與工程化實踐、Agent 安全與可信治理、企業級研發體系重構等 14 大專題全面開啟,誠摯邀請你登臺分享實戰經驗。AICon 2026,期待與你同行。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.