![]()
一次低級失誤,讓全球開發者拿到了 AI 編程工具的「行業標準答案」。
作者|樺林舞王
編輯|靖宇
如果幾天前有人告訴我,號稱「最重視 AI 安全」的 Anthropic,會在一周之內連續泄露兩次核心機密,我大概會覺得這是愚人節段子。
但它偏偏發生在愚人節前一天。
3 月 31 日,安全研究員 Chaofan Shou 發現,Anthropic 在 npm 上發布的 Claude Code 2.1.88 版本里,塞了一個 59.8MB 的 source map 文件。這個本該用于內部調試的文件,指向了 Anthropic 自己 Cloudflare R2 存儲桶里的一個 zip 壓縮包——里面是 Claude Code 完整的 TypeScript 源代碼,約 1900 個文件,51.2 萬行代碼。
幾小時內,GitHub 上出現了多個鏡像倉庫。其中一個名叫「claw-code」的項目,兩小時內拿下 5 萬顆星,成為 GitHub 歷史上漲星最快的倉庫。fork 數超過 4.15 萬。
而就在五天前,Anthropic 剛剛因為一個未加保護的公開數據緩存,泄露了下一代模型「Mythos」的存在——一個被內部描述為「能力階躍式提升」、在網絡安全能力上「遠超所有現有 AI 模型」的新模型。
一周兩次泄露。一個講安全的公司,被自己的安全問題打了臉。開發者社區的評價相當統一——「諷刺得不真實」。
但諷刺歸諷刺,泄露出來的東西,是真的有料。一個更重要的問題是,AI 公司,應該如何利用這次「泄露」,抄作業?
01
Claude Code「殼子」里有什么?
很多人第一反應是:Claude Code 不就是一個套了模型 API 的命令行工具嗎?源代碼泄露了又怎樣,沒有模型權重,這些代碼不過是個「殼子」。
這個判斷對了一半。Claude Code 確實是個殼子,但它是一個精密到讓人意外的殼子。
先看工具系統。Claude Code 采用了類似插件的架構,每種能力——文件讀寫、shell 執行、網頁抓取、LSP 集成——都是一個獨立的、有權限管控的工具模塊。光是工具定義層就有 2.9 萬行 TypeScript。
每個工具的描述不是簡單的一句話,而是詳細到告訴模型「什么時候該用這個工具、怎么用、用完之后期望什么結果」。這些描述本身就是一種精心調優的 prompt engineering。
再看記憶系統。泄露代碼揭示了一個三層「自修復記憶」架構。最底層是 MEMORY.md,一個輕量級索引文件,每行大約 150 個字符,始終加載在上下文中。具體的項目知識分散在「主題文件」里,按需加載。原始對話記錄則永遠不會整體回讀到上下文中,只在需要時通過 grep 檢索特定標識符。
也就是說,Anthropic 的工程師花了大量時間解決的核心問題,不是「怎么調用 API」,而是「怎么在有限的上下文窗口里,讓模型盡可能聰明地工作」。
然后是那個讓所有人都興奮的 KAIROS。
這個以古希臘語「恰當的時機」命名的功能,在源代碼中被提及超過 150 次。它是一個自主守護進程模式,讓 Claude Code 作為一個 always-on 的后臺代理持續運行。更有意思的是它的「autoDream」邏輯——在用戶空閑時,代理會進行「記憶整合」,合并零散觀察、消除邏輯矛盾、把模糊洞察轉化為確定性事實。
換句話說,Anthropic正在讓 AI 編程助手從「你問我答」的工具,進化為一個「持續理解你的項目、主動發現問題」的協作者。
此外,泄露代碼還包含 44 個未上線的 feature flag,覆蓋了多代理協調模式(COORDINATOR MODE)、語音交互(VOICE_MODE)、30 分鐘遠程規劃會話(ULTRAPLAN),甚至還有一個拓麻歌子風格的終端寵物(BUDDY),有 18 個物種和稀有度等級。
還有兩個細節值得一提。一個是「frustration regex」——一段正則表達式,用來檢測用戶是否在罵 Claude。用正則比用模型推理來判斷用戶情緒要快得多、便宜得多。
另一個是「undercover mode」,Anthropic 用 Claude Code 給公開的開源項目做「隱身貢獻」,系統提示詞明確寫著:「你正在 UNDERCOVER 模式下運行……你的 commit 信息不能包含任何 Anthropic 內部信息。不要暴露身份。」
02
中國 AI 公司能學到什么
現在回到真正重要的問題。
過去一年,中國 AI 編程工具賽道明顯加速。字節的 Trae 已經從最初的 MarsCode 演進為一個 AI 原生 IDE,集成了 Agent 模式,支持從需求理解到代碼編寫再到測試的全流程自動化。智譜的 CodeGeeX 主打開源和本地部署,在中文代碼理解上做了深度優化。通義靈碼、豆包 MarsCode 也都在快速迭代。
但如果拿這些產品和 Claude Code 泄露的架構對比,差距不在「能不能用」,而在工程精細度上。
第一課:工具描述就是產品力。
這可能是最容易被忽視、也最值得學的一點。
Claude Code 對每個工具的 prompt 描述經過了極其精細的調優——什么時候用、什么時候不用、用了之后怎么處理結果、出錯了怎么重試。這些描述本質上是在教模型「怎么做一個好的程序員」。
國內很多工具的 tool use 實現還停留在「給模型一個函數簽名,讓它自己猜怎么用」的階段。光是把工具描述寫到 Claude Code 的水平,就能讓同一個模型的表現提升一個檔次。
第二課:記憶架構,比模型參數更影響用戶體驗。
Claude Code 的三層記憶系統解決的是一個很現實的問題——模型的上下文窗口是有限的,你不能把所有歷史對話都塞進去。
Anthropic 的做法是把記憶分層——熱數據始終在線,溫數據按需加載,冷數據只做索引。這種思路并不新鮮,但它在 AI 編程工具里的工程實現,國內團隊大多還沒做到這個精細度。
第三課:情緒感知不是玄學,是工程問題。
用一段正則表達式檢測用戶是否在發火,然后調整回復策略。
這個方案簡單到粗暴,但極其實用。它告訴你一個道理——好的 AI 產品不是每個問題都需要用模型來解決,有時候一個 regex 就夠了。
國內做 AI 工具的團隊,經常陷入「所有問題都要丟給大模型」的思維慣性,這是一種浪費。
第四課:KAIROS 指向的方向,比 KAIROS 本身更重要。
一個 always-on 的后臺代理,在用戶不用的時候自動整理記憶、發現問題。
這個產品方向意味著 AI 編程助手的下一步不是「更快地回答問題」,而是「在你沒有問問題的時候,就已經在工作」。
目前國內的 AI 編程工具幾乎全部是響應式的——用戶發指令,工具執行。
誰先把守護進程模式做出來,誰就可能定義下一代產品形態。
03
「抄」的邊界在哪里
當然,學習和抄襲之間有一條線。
法律層面,這不是開源代碼,而是意外泄露的商業軟件。直接基于泄露代碼構建產品,版權風險是明確的。GitHub 上「claw-code」宣稱要用 Rust 重寫,但如果核心邏輯照搬,法律邊界依然模糊。
對于中國公司來說,在出海壓力越來越大的背景下,這種風險需要認真評估。
技術層面,Claude Code 的很多設計決策,是針對 Claude 模型能力深度定制的。比如它的工具描述寫得那么長、那么詳細,是因為 Claude 的長上下文處理能力足夠強,不會因為系統提示詞太長而「走神」。換成上下文窗口短、指令遵循弱的模型,照搬同樣的 prompt 策略可能適得其反。
真正聰明的做法不是 fork 這 51 萬行代碼,而是理解每一個設計決策背后的 tradeoff,然后針對自己的模型特點重新實現。
架構思路可以學,工具編排模式可以學,記憶分層策略可以學——但實現必須是自己的。
還有一個容易被忽略的現實——Anthropic 泄露的是一個快照,而他們的工程團隊每天都在迭代。44 個 feature flag 意味著至少十幾個重大功能在排隊上線。
你今天 fork 的代碼,下個月就是舊版本。追著抄,永遠追不上;理解了原理,才能跑出自己的路線。
這次泄露最大的意義可能不在技術細節,而在于它撕掉了一層神秘感——原來 Anthropic 最核心的 AI 編程工具,底層也不過是精心設計的 prompt 編排,加上工程化的工具調度。
沒有黑魔法,只有大量的細節打磨。
這對中國 AI 公司來說,其實是個好消息。它意味著差距是可以彌合的。前提是,你得有耐心去打磨那些細節——而不是想著直接把別人的代碼拿過來改個名字。
*頭圖來源:LinkedIn
本文為極客公園原創文章,轉載請聯系極客君微信 geekparkGO
傳統短劇劇組急剎車,AI 產能大爆發,短劇行業正在經歷殘酷的「大換血」。本期直播,極客公園邀請一線 AI 短劇操盤手與 AI 視頻技術專家:aipai.ai創始人陳坤、九紫源AI創始人/總導演丁寬、可靈AI 創作者及行業運營負責人王若暄。
今晚 20:00,極客公園視頻號直播間,一起聊聊:當 GPU 接管了導、演、攝、錄,AI 短劇的機會究竟在哪里?短劇行業的下半場要拼什么?
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.