“給它一個簡單任務——‘添加用戶資料頁,鏈接到導航欄’。它說‘包在我身上’,寫了點代碼。你運行,報導入錯誤。你把錯誤貼回去,它道歉、重寫文件,路由壞了。再貼回去。迭代十輪后,配置神秘消失,導航欄整個沒了,它還試圖裝一個過時的React版本。”
這不是什么夸張段子。用過自主AI編程代理的人,對這套流程大概都不陌生。一個本來十分鐘能搞定的活兒,最后演變成凌晨兩點還在回滾代碼的災難現場。我把這個現象叫做**AI代理的厄運循環**。
問題出的地方,不是模型不夠聰明。正好相反——是我們把“智能”和“守規矩”搞混了。
根因:上下文腐壞
當前的代理框架有個通病:把一萬個token的系統提示一股腦塞給代理,指望它在執行循環走到第45步時還能記得你的架構約束。現實是,它很少能記住。
當代理剛啟動一個任務時,上下文是干凈的。但隨著它讀文件、執行命令、撞上各種錯誤,上下文窗口逐漸被亂七八糟的堆棧追蹤和之前失敗的嘗試填滿。走到20步深的時候,你精心撰寫的系統提示早被淹沒在垃圾信息底層。代理開始忘掉架構規范,它優先處理的不是整體目標,而是眼前剛彈出的那個報錯。這時候,它就開始猜、開始幻覺、開始把局面越攪越糟。
我之所以動手做Agent Rigor,就是受夠了這種“保姆式盯梢”——看著代理把自己寫進死胡同,然后等你來救場。
解法:漸進式披露與經驗主義紀律
Agent Rigor既不是新的大語言模型,也不是什么魔法提示詞包裝器。它是給代理配的一套操作系統,強制推行一種嚴格的“拿證據說話”的紀律。
不是靠一個巨型提示搞定一切,而是用三層架構來管這件事:
第一層,尖峰內核(L1)——定死的、不容商量的鐵律。比如:“絕不要猜API簽名,先用grep搜或用工具讀源文件確認。”
第二層,階段導演(L2)——編排邏輯,只有代理進入特定階段(規劃、執行、驗證)時才加載。平時不占上下文位置。
第三層,技能協議(L3)——針對特定任務的具體指令,比如自我糾錯流程。只有當該任務真正啟動時才加載對應協議。
這個思路叫做漸進式披露。代理在每個原子步驟中,只看到它當下絕對需要的那幾條指令。其他的一律不出現。
更關鍵的是,Agent Rigor強制推行“已知良好狀態”策略。如果一次測試掛了,代理不會繼續對著同一個文件盲目修改。它會先回滾,分析實際證據,然后規劃新方案。不再有那種“看起來好像可以”就往上提交的習慣。每往前走一步,都得先用經驗數據證明這一步沒走錯。
別當保姆了,該上工程手段了
如果你在用Cursor、Copilot或者其他任何編程助手寫代碼,你需要一個紀律層。不是給模型再加聰明,而是讓這套系統學會不越軌。
具體實現可以看開源倉庫里的做法。如果它能幫你省下凌晨兩點回滾一團亂麻代碼的慘劇,去給它點個星。更重要的——如果你覺得這套思路有問題,開個issue,告訴我你的理由。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.