3月31日,Anthropic照常更新Claude Code,版本號2.1.88,看著毫無波瀾。
一個小時后,安全研究員Chaofan Shou在X上發了條帖子:他翻npm包,找到一個source map文件,里面藏著Claude Code的完整TypeScript源代碼。
51.2萬行代碼、1900個文件、35+子系統全部曝光。
24小時內,GitHub上冒出多個fork倉庫,其中一個拿下3.2萬星標、4.4萬次fork。全球開發者像拆圣誕禮物一樣,把這個AI編程工具翻了個底朝天。
看完代碼大家才意識到用好AI的門道原來這么多,所謂「Harness工程」原來這么玩!
今天,我們聊聊這堂價值數十億美元的系統架構公開課。
![]()
Python重構避免版權問題的claw-code項目飆升 Claude Code這次究竟暴露了啥?
先澄清一個誤解:這些泄露的不是AI模型。
這次暴露的是Anthropic官方套殼的Claude Code代碼,涉及到怎么調度AI模型、管理記憶、執行工具、處理權限,這一整套工程代碼。
打個比方:AI模型是千里馬,泄露的是馴馬師的全套手冊。技術上看影響好像還好,但這事可能比泄露模型權重更重要。
它等于告訴所有開發者、用戶,AI編程賽道頭部玩家如何管理AI員工、設計AI產品。
看完這套框架,你不一定能開發出好的AI產品,但一定對用好AI會有更深的理解。
![]()
三層記憶與睡眠模式
用AI寫過代碼的人大概都碰過這種事:前10分鐘它還記得你的項目結構,半小時后就開始犯糊涂,把寫好的函數名搞錯,甚至忘了你在做什么。
業內有時候會把這種情況稱為「上下文熵增」:對話越長,AI越容易產生幻覺和矛盾。所有AI編程工具都卡在這里。
Claude Code的源代碼揭示了Anthropic的解法:三層記憶架構。
第一層:MEMORY.md 輕量索引
每次會話啟動,Claude Code都會加載一個叫MEMORY.md 的文件。這個文件不存數據,存的是各種信息、文件地址,每行大約150個字符,指向具體的文件。類似圖書館的索引卡,告訴AI哪個文件放在哪個文件夾,你需要了自己去拿。
為了避免索引被濫用,還設置了25KB的上限,需要持續優化,防止「工作記憶」被垃圾信息淹沒。
第二層:主題文件,按需加載
簡單說就是項目知識分散在多個主題文件中,用到才加載。你在改前端代碼,AI不會把后端架構文檔也塞進來占token。
盡可能降低AI的上限文窗口占用。
第三層:完整會話記錄,可搜索但不回讀
這是最有趣的一個點,Claude Code得所有歷史對話都會保存,但AI不會每次執行任務都把以前的對話都看一遍。
只有需要了解某個具體細節時,Claude Code會搜索,提取相關片段,看看當時提的要求是什么,怎么設計的。
三層配合,用最小的上下文開銷覆蓋最大的知識范圍,已經是很精妙了設計,但源代碼里還藏著更有趣的東西。
聊天多了、執行多了,記憶同樣會爆炸,前面的優化只是解決眼下的問題,面對信息爆炸該怎么辦?
Anthropic設計了后臺進程KAIROS,它會執行名為AutoDream(對,就叫「自動做夢」)的程序,就像人類睡覺時大腦整理記憶一樣,在不干活時悄悄管理記憶。
AutoDream之前就已經公布了,但這次暴露了它的實現原理:
定向掃描:讀取記憶索引和已有主題文件
信號采集:從每日日志里提取新信息,檢測「記憶漂移」,揪出跟當前代碼矛盾的舊記憶
整合歸并:把新信號合并進主題文件,相對日期轉絕對日期,刪掉過時的事實
修剪索引:更新MEMORY.md,控制在25KB以內
Claude Code正在變成「常駐CTO」,記住你的項目,后臺主動消化、整理、更新對項目的理解。
提示詞工程到「Harness 工程」
看到這,無論你用AI的水平如何,想必都能感受到Anthropic在管理AI上確實有一套。
值得我們學習的還不止這些!
源代碼泄露前一周,Anthropic官方博客發了一篇被嚴重低估的文章:《Harness Design for Long-Running Application Development》。
作者Prithvi Rajasekaran來自Anthropic Labs團隊,提了一個新概念:Harness Engineering,韁繩工程。
2024年是「提示詞工程」元年,2025年輪到「上下文工程」,2026年新戰場叫「韁繩工程」。
所謂「韁繩工程」就是隨著AI能力繼續提升,我們需要的已經不是簡單的一句一句和AI對話,而是要設計一套系統,馴服AI寫代碼的過程,讓它在長時間復雜任務里不跑偏、不掉鏈子。
Rajasekaran發現,AI獨立完成復雜編程任務有兩個致命問題:
上下文焦慮,對話變長,AI開始「緊張」,覺得自己快用光上下文窗口了,于是匆忙收尾、草率交活。這是行為問題,不是幻覺問題。
自我評估偏差,讓AI檢查自己寫的代碼,跟讓學生給自己的考卷打分一樣,幾乎總給高分,哪怕代碼一塌糊涂。
他的解法借鑒了GAN(生成對抗網絡)的思路:Generator(生成器):負責寫代碼,Evaluator(評估器):負責打分、找bug、提改進意見。
兩個獨立的AI,一個干活,一個挑刺。評估器用Playwright實際操作運行中的應用,點按鈕、填表單、測API,然后按詳細標準打分反饋。
同一句需求:「做一個2D復古游戲編輯器,包含關卡編輯、精靈編輯、實體行為和可玩測試模式。」
任務跑下來,效果驚人、成本也驚人:普通模式下一個Agent開發20分鐘,花了9美元,做出一個能看不能玩的游戲。
采用Harness工程,AI開發了6個小時,花了200美元,但造出了真正的游戲,不光完成了基本需求,還自動擴展出16個功能模塊:精靈動畫系統、行為模板、音效音樂、AI輔助關卡設計、游戲導出和分享鏈接。
貴了20倍以上,但也帶來了真實能力的質變。
普通人可能只看到花更多錢就能取得更好的效果,但真正的創業者會意識到,好的「Harness工程」藏著巨大的機會。
你不需要會開發AI大模型,只是在模型的管理與控制上有一套自己的解法,或許就能推出一個嶄新的產品。
![]()
官方演示的游戲原型 重新認識AI時代的護城河
AI工具的護城河在哪?這個問題的答案一直在變。
2024年拼模型能力,2025年大家在提上下文管理,到了2026年回到了最本質的問題:系統工程。
Claude Code的泄露就是告訴大家:模型是發動機,模型之上的各種設計才能造出真正的賽車。
從提示詞工程到上下文工程,再到韁繩工程,AI時代的技術范式每半年刷新一次。
面對這么多概念、炒作,你是不是感覺手足無措?無從下手?
如果你也想快速了解最新、最有價值的AI用法,成為駕馭AI工程的人,歡迎加入前哨AI小課第五季
前哨AI小課2022年上線,Tina幫助數千會員持續迭代,掌握最前沿的AI工具、最佳實踐,幫助大家把AI用到自己的工作生活中。
與其碎片化地追熱點,不如用一套結構化課程,把AI的底層邏輯一次搞清楚。
掃碼/點擊鏈接,加入「前哨AI小課」,用最短時間建立最扎實的AI認知。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.