![]()
編譯 | 宇琪
策劃 | Tina
在 AI 編程工具進(jìn)入大亂斗時(shí)代的今天,我們似乎已經(jīng)習(xí)慣了各種功能的堆疊。但在 libGDX 創(chuàng)始人、17 年開源老兵 Mario Zechner 眼中,這一切正變得越來越不可控。
“當(dāng)你發(fā)現(xiàn) AI 在背地里偷偷修改你的上下文,而你卻對此一無所知時(shí),這種掌控感的喪失是極其危險(xiǎn)的。”
近日,在 Tessel 舉辦的開發(fā)者大會(huì)上,Mario 不僅公開吐槽了 Claude Code、OpenCode,更帶出了他的極簡主義“反叛之作”——pi。這是一個(gè)只有 read、write、edit、bash 四種工具,擁有主流 agent 里最短的 system prompt,卻有著極致的可擴(kuò)展性、能讓開發(fā)者重拾掌控權(quán)的終端編程 agent。
本文基于該演講視頻整理,經(jīng) InfoQ 編輯。
核心觀點(diǎn)如下:
Claude Code 現(xiàn)在就是一架宇宙飛船,它功能多到你可能只用過其中的 5%,了解的也就 10%,剩下 90% 全是 AI 和 agents 領(lǐng)域的“暗物質(zhì)”,沒人知道它背地里到底在干嘛。
現(xiàn)有的編程框架里,很多功能可能并不是獲得好結(jié)果的必需品。不需要文件工具,不需要子 agent,不需要聯(lián)網(wǎng)搜素,啥都不需要。
我們現(xiàn)在正處于“一邊瞎折騰一邊看結(jié)果”的階段,沒人知道完美的編程 agent 到底該長啥樣。我們需要更好的“折騰”方式,編程 agent 必須是可自修改、可塑性極強(qiáng)的,這樣我們才能快速實(shí)驗(yàn)新想法,看看能不能折騰出某種新的行業(yè)標(biāo)準(zhǔn)或 workflow。
真正需要 linting 和類型檢查的時(shí)機(jī)只有一個(gè):那就是 agent 覺得自己徹底完活兒的時(shí)候。
1ChatGPT→Copilot→Aider→Claude Code
2025 年 4 月左右,Peter Steinberger(OpenClaw 創(chuàng)始人)跑來跟我還有 Armin Ronacher(Sentry 聯(lián)合創(chuàng)始人、Flask Web 框架創(chuàng)建者)說:“現(xiàn)在的 Coding Agents 真的進(jìn)化到能干活的程度了。” 我當(dāng)時(shí)的第一反應(yīng)是:“噢,快給我閉嘴吧!”我是真不信這玩意兒。但一個(gè)月后,我們幾個(gè)就在公寓里閉關(guān)了 24 小時(shí),整夜沉浸在這些 clankers、wipe coat 和 wipe slop 的世界里。
我們不停地造東西,造了一大堆,但絕大多數(shù)我們自己從來沒用過。這就是 2025 到 2026 年的新常態(tài):我們寫了很多代碼,造了很多輪子,但真正用上的沒幾個(gè)。折騰到最后我開始想,我討厭現(xiàn)有的所有 Coding Agents 或開發(fā)框架,自己寫一個(gè)到底能有多難?當(dāng)時(shí) Peter 說:“我只想做一個(gè)屬于自己的小玩意兒。”后來的故事大家可能都知道了。
今天,我要講的是我那個(gè)沒那么驚天動(dòng)地的故事,但我希望能在其中分享一些我在過去幾個(gè)月里攢下的行業(yè)洞察。
先聊聊 Coding Agents 的演進(jìn)史。
2025 年之前的情況基本就是:從 ChatGPT 搬運(yùn)代碼,但代碼大多是碎的,通常只能寫一些你不想親自動(dòng)手的簡單函數(shù)。然后有了集成在 Visual Studio Code 里的 GitHub Copilot,只需要一路 tap tap tap,雖然有時(shí)候靈,大多數(shù)時(shí)候并不。甚至有時(shí)候,它還會(huì)非常“貼心”地給你默寫一段 GPL 協(xié)議的代碼,比如 John Carmack 的那個(gè)平方根倒數(shù)速算法之類的。后來又有了 Aider,當(dāng)時(shí)還有 AutoGPT。
最后,Claude Code 登場了。我記得他們在 2024 年 11 月發(fā)布了 beta 版,但真正火起來是在 2025 年 2 月或 3 月的樣子。當(dāng)時(shí)我覺得這玩意兒簡直太棒了,Claude 團(tuán)隊(duì)非常出色,他們在社交媒體上很活躍,人也都很天才。
說實(shí)話,他們基本上開創(chuàng)了整個(gè)品類。雖然之前有 Aider 和 AutoGPT 鋪路,但沒有一個(gè)能達(dá)到這種高度。這就是所謂的 agentic search(智能體搜索)范式:它不像 Cursor 那樣先進(jìn)入你的 codebase 做索引、搞各種復(fù)雜的構(gòu)建(雖然那樣搞也未必好使)。Claude 團(tuán)隊(duì)直接通過強(qiáng)化訓(xùn)練,讓模型學(xué)會(huì)使用文件工具和 bash 工具,通過這種方式實(shí)時(shí)探索你的 codebase,尋找理解代碼所需的信息并直接修改。這效果簡直驚人,我們直接不睡覺了,因?yàn)楫a(chǎn)出的代碼量比以前純手寫翻了不知道多少倍。
那時(shí)候它簡單、可預(yù)測,完美契合我的 workflow。但后來,他們掉進(jìn)了一個(gè)我們很多人都會(huì)掉進(jìn)去的陷阱:既然這些 clankers 能寫這么多代碼,為什么不讓它把所有能想到的 feature 都寫了呢?這主意聽起來不錯(cuò)吧?咱們加這個(gè)功能,加那個(gè)功能,加加加……最后搞出了一個(gè)類似 Homer Simpson 設(shè)計(jì)的那種怪物。Claude Code 現(xiàn)在就是一架宇宙飛船,它功能多到你可能只用過其中的 5%,了解的也就 10%,剩下 90% 全是 AI 和 agents 領(lǐng)域的“暗物質(zhì)”,沒人知道它背地里到底在干嘛。
2Claude Code 不是一個(gè)穩(wěn)定的好工具
我個(gè)人覺得這并沒什么用,因?yàn)槲沂冀K認(rèn)為開發(fā)者需要知道 agent 到底在做什么。我們現(xiàn)在在 Tessel 的活動(dòng)現(xiàn)場,他們也喜歡搞 context management/engineering。但我最終發(fā)現(xiàn),Claude Code 在可觀測性和上下文管理方面并不是一個(gè)好工具。而且,誰受得了 Claude Code 的那種沒完沒了的、莫名其妙的閃爍?
![]()
Anthropic 的開發(fā)者關(guān)系專家 Thariq Shihipar 有時(shí)候會(huì)在 Twitter 上說些讓人摸不著頭腦的話,比如:“我們的 terminal user interface 現(xiàn)在是一個(gè)游戲引擎了。”
我是做游戲開發(fā)出身的,那是我的老本行。當(dāng)我看到這種話時(shí),心真的會(huì)滴血。那只是個(gè)終端界面,你之所以覺得它是游戲引擎,是因?yàn)槟阍诮K端界面里用了 React,結(jié)果導(dǎo)致重新渲染整個(gè) UI 樹要花掉 12 毫秒。別這么干好嗎?它真不是游戲引擎。
![]()
后來寫 Ghostty 的 Mitchell 也忍不住了,他說:“這聽起來有點(diǎn)冒犯。別把鍋甩給 Ghostty 或者其他終端,純粹是因?yàn)槟愕拇a太爛了。”終端渲染一幀只需要不到 1 毫秒,每秒能跑幾百幀,所以別拿這個(gè)當(dāng)借口。
![]()
雖然后來他們修好了閃爍,但別的問題接踵而至。你會(huì)感覺到他們徹底倒向了所謂的 vibe coding,這種感覺在你每天使用 Claude Code 時(shí)尤為明顯。我并不是要貶低他們的努力和成果,Claude Code 依然是這個(gè)品類的領(lǐng)頭羊,他們開創(chuàng)了這一切且做得非常棒。我只是個(gè)喜歡簡單、可預(yù)測工具的老頭子,而它已經(jīng)不再契合我的 workflow 和需求了。
而且,他們在后臺偷偷對你的 context 做了很多手腳。2025 年夏天,我寫了一堆工具去攔截 Claude Code 發(fā)往后端的請求,想看看他們在背地里往我的 context 里塞了哪些額外的文字。結(jié)果發(fā)現(xiàn)這些操作非常多余,而且每天都在變。可能今天發(fā)個(gè)版本,明天又發(fā)個(gè)版本,注入內(nèi)容的時(shí)機(jī)和方式變來變?nèi)ィ@會(huì)直接搞亂你現(xiàn)有的 workflow。它不是一個(gè)穩(wěn)定的工具。
我理解他們的立場,他們需要實(shí)驗(yàn),而且用戶基數(shù)巨大,在龐大用戶群的基礎(chǔ)上做實(shí)驗(yàn)確實(shí)很難。但他們并不在意用戶的感受,所以我們都得跟著受罪:你正用著這個(gè)新工具,努力構(gòu)建可預(yù)測的 workflow,然后工具廠商在引擎蓋下改了個(gè)不起眼的小細(xì)節(jié),就導(dǎo)致 LLM 在處理你現(xiàn)有任務(wù)時(shí)直接發(fā)瘋。這根本沒法持續(xù),我需要掌控感,我不能指望他們給我提供一個(gè)所謂的“穩(wěn)定環(huán)境”。
作為 UI 設(shè)計(jì)的代價(jià),他們不得不降低可觀測性。我個(gè)人不喜歡這樣,但這只是個(gè)人偏好,我知道大多數(shù)人對于 Claude Code 展示的信息量已經(jīng)很滿意了。另外,它顯然沒有模型選擇權(quán),因?yàn)樗?Anthropic 的原生工具。這不算壞處,但它幾乎沒有任何擴(kuò)展性。雖然他們有一套 hook 系統(tǒng),但如果你對比一下 pi 能實(shí)現(xiàn)的功能,你會(huì)發(fā)現(xiàn)他們的集成度并不深。而且它基本是基于在 hook 事件觸發(fā)時(shí)運(yùn)行一個(gè)進(jìn)程,如果你需要反復(fù)啟動(dòng)那個(gè)進(jìn)程,開銷真的非常昂貴。
后來,我徹底對 Claude Code 下頭了。倒不是說它做得爛,只是它不再適合我了。在那段時(shí)間里,它變得適合更多的大眾用戶,這說明他們路子走對了,只是不適合我這種老古董。
3OpenCode 的底層設(shè)計(jì)讓我失去信心
于是我開始到處找替代方案。首先是 Codex CLI,剛開始我挺不喜歡它的,無論是界面還是模型,不過現(xiàn)在它的模型表現(xiàn)確實(shí)挺驚艷的。接著是 AMP,這個(gè)團(tuán)隊(duì)的核心成員以前在 Sourcegraph 工作,后來出來單干了,都是極其頂尖的工程師。他們居然做出了一款非常商業(yè)化的 coding harness,而且是靠“砍功能”而不是“堆功能”來贏得市場,他們的很多設(shè)計(jì)邏輯跟我簡直不謀而合。如果你想要個(gè)商業(yè)化的編程框架,我絕對推薦 AMP。Factory 也是類似的思路,做得很扎實(shí),只是沒像 AMP 那么激進(jìn)和富有實(shí)驗(yàn)精神。
然后就是 OpenCode 了,很多人都在用的開源框架。我這人有開源情懷,在開源圈摸爬滾打了 17 年,大大小小的項(xiàng)目都管過,開源對我來說意義非凡。所以我當(dāng)時(shí)想,既然 OpenCode 離我這么近,那就試試吧。而且說實(shí)話,除了 AMP,OpenCode 的團(tuán)隊(duì)是這個(gè)圈子里最接地氣、最務(wù)實(shí)的,他們不會(huì)整天拿那些你八輩子用不上的功能來忽悠你,而是努力維持一個(gè)非常穩(wěn)定的核心體驗(yàn)。他們對“編程 agent 對我們職業(yè)意味著什么”的思考,我也非常認(rèn)同。
但 OpenCode 的問題在于:它在上下文管理上做得一塌糊涂。比如,它每一輪對話都會(huì)調(diào)用一個(gè)叫 SessionCompaction.prune 的函數(shù),把最后 4 萬個(gè) token 之前的記錄全給刪了。大家應(yīng)該都知道 prompt caching(提示詞緩存)吧?它這么干意味著把你的 cache 全毀了。
OpenCode 和 Anthropic 之間有一段挺有意思的過節(jié)。在我看來,Anthropic 后來的態(tài)度邏輯很通順:“你們不能這么搞。”雖然這事兒沒公開鬧大,但道理很簡單:如果你去健身房卻不守規(guī)矩,濫用人家的基礎(chǔ)設(shè)施,你肯定會(huì)被拉黑。雖然我沒證據(jù),但我猜這就是為什么 Anthropic 和 OpenCode 之間關(guān)系緊張的原因。我完全站在 Anthropic 這邊,別去糟蹋人家的基礎(chǔ)設(shè)施。
還有些別的坑,比如 OpenCode 自帶了 LSP(語言服務(wù)器協(xié)議)支持。假設(shè)你給 agent 下了個(gè)任務(wù),讓它改一堆文件。實(shí)際操作中它會(huì)怎么干?它會(huì)一個(gè)接一個(gè)地改。你覺得它改完第一輪,代碼能編譯通過的概率有多大?當(dāng)你一行一行改代碼時(shí),得花多久才能讓它重新回到編譯通過的狀態(tài)?答案是根本回不去。可能改完第一處、第二處,代碼還是崩的。
這時(shí)候如果你跑去問 LSP 服務(wù):“嘿,我剛改了這一行,代碼崩了嗎?”LSP 肯定會(huì)說:“是的,徹底崩了。”然后這個(gè)功能就會(huì)把報(bào)錯(cuò)信息直接塞進(jìn) tool call 后面,反饋給模型:“你剛才干錯(cuò)了。”模型一臉懵逼:“搞什么?我還沒改完呢!你現(xiàn)在跟我說這個(gè)?”這種事發(fā)生得多了,模型最后就會(huì)直接罷工,導(dǎo)致產(chǎn)出的結(jié)果非常糟糕。所以我特別反感在 agent 工作時(shí)掛 LSP。真正需要 linting(代碼檢查)和類型檢查的時(shí)機(jī)只有一個(gè):那就是 agent 覺得自己徹底完活兒的時(shí)候。
而且 OpenCode 最近有個(gè)變化:在一個(gè) session 里,每一條消息居然都會(huì)被保存為一個(gè)獨(dú)立的 JSON 文件。這在我看來,說明它在整個(gè)架構(gòu)設(shè)計(jì)上缺乏深度思考。一旦我對這種底層設(shè)計(jì)失去信心,我就不想再用這個(gè)工具了。
此外,OpenCode 默認(rèn)帶了一個(gè) server 架構(gòu),客戶端連接到服務(wù)端,終端界面只是其中一個(gè)客戶端。這原本挺高端,結(jié)果卻爆出了一個(gè)默認(rèn)自帶的遠(yuǎn)程代碼執(zhí)行(RCE)安全漏洞。如果你對自己的服務(wù)器架構(gòu)那么自豪,我默認(rèn)你應(yīng)該是一群成熟的工程師,至少考慮過安全性吧?但顯然他們沒考慮,而且這個(gè)洞開了很久。我也不是要指責(zé)誰,在現(xiàn)在這種前所未有的、快到讓人頸椎骨折的行業(yè)節(jié)奏下,出錯(cuò)難免,但我是不想用這種存在隱患的工具。
這就是我對現(xiàn)有 coding harnesses 的觀察。AMP 其實(shí)不錯(cuò),但我沒有掌控權(quán),它甚至?xí)Q定你用哪個(gè)模型處理哪類任務(wù),這不符合我的性格。
后來因?yàn)橐恍﹦e的原因,我開始研究 Benchmark(基準(zhǔn)測試),結(jié)果發(fā)現(xiàn)了 TerminalBench。簡單來說,它是一個(gè)專門針對 agent 的評估 harness,包含了大量和計(jì)算機(jī)操作、編程相關(guān)的任務(wù)。它有大約 82 個(gè)非常多樣化的任務(wù),從“修好我的 Windows 設(shè)置”到“幫我寫一個(gè)蒙特卡洛模擬”。它有個(gè)排行榜,上面列出了各種 agent 框架和模型的組合。
其中有一個(gè)叫 Terminus 的 agent 讓我覺得非常驚艷,它是排行榜上表現(xiàn)最好的框架之一。它是怎么做的呢?模型拿到的只有一個(gè) tmux session,它唯一能做的就是發(fā)送按鍵,然后讀取返回的 VT 序列碼。這是模型和電腦之間最極簡、最原始的接口了。然而,它的表現(xiàn)卻是頂級的。
這說明了什么?我們真的需要那些花里胡哨的功能來讓模型干活嗎?
對我個(gè)人而言,這不只是模型好不好的問題,還有作為用戶的“人”該如何與 agent 交互。Terminus 的用戶體驗(yàn)或開發(fā)者體驗(yàn)顯然不是我想要的,但它證明了一點(diǎn):現(xiàn)有的編程框架里,很多功能可能并不是獲得好結(jié)果的必需品。不需要文件工具,不需要子 agent,不需要聯(lián)網(wǎng)搜素,啥都不需要。
基于這些發(fā)現(xiàn),我總結(jié)了兩個(gè)核心論點(diǎn):第一,我們現(xiàn)在正處于“一邊瞎折騰一邊看結(jié)果”的階段,沒人知道完美的編程 agent 到底該長啥樣。大家都在嘗試,有人走極簡路線,有人走“宇宙飛船”路線,搞什么 agent 集群、完全自治。我覺得這事兒還沒定論,行業(yè)標(biāo)準(zhǔn)還沒出現(xiàn)。
第二,我們需要更好的“折騰”方式,編程 agent 必須是可自修改、可塑性極強(qiáng)的,這樣我們才能快速實(shí)驗(yàn)新想法,看看能不能折騰出某種新的行業(yè)標(biāo)準(zhǔn)或 workflow。
所以我的基本思路非常簡單:剝離掉一切冗余,構(gòu)建一個(gè)極簡且可擴(kuò)展的核心,再稍微加點(diǎn)讓人用著舒服的小功能。它不是一張純粹的白紙,但也絕對不臃腫。
4Pi:讓 Coding Agent 適應(yīng)你的需求
pi 的核心理念很簡單:讓你的 Coding Agent 去適應(yīng)你的需求,而不是反過來。
![]()
整個(gè)系統(tǒng)只由四個(gè) package 組成。首先是 AI package,本質(zhì)上是對多種 provider 的一個(gè)輕量抽象層。因?yàn)椴煌?provider 使用不同的 transport protocol,這一層幫你把復(fù)雜性都抹平了。你可以在同一個(gè) context 或 session 里非常輕松地和不同 provider 對話、隨時(shí)切換。接下來是 agent core,一個(gè)通用的 agent loop,包含 tooling、定位、驗(yàn)證等等基礎(chǔ)能力。然后是 TUI,大概只有 600 行代碼,但出奇地好用,可能因?yàn)椴皇悄硞€(gè) clanker 寫的。最后是 Coding Agent 本身,它既可以作為一個(gè) SDK,在 headless 模式下使用,也可以作為一個(gè)完整的終端交互式 Coding Agent。
![]()
系統(tǒng) prompt 就這么多,全部都在這了。和其他 coding harness 那種動(dòng)輒一大堆 token 的 system prompt 相比,這里幾乎是“空”的。原因其實(shí)很直白:frontier models 已經(jīng)通過大量 RL 訓(xùn)練,早就“知道”什么是 Coding Agent 了。所以反復(fù)告訴它“你是一個(gè) Coding Agent”“你應(yīng)該怎么寫代碼”?其實(shí)沒有必要。
默認(rèn)就是 YOLO 模式(默認(rèn)直接執(zhí)行,不向用戶確認(rèn),全自動(dòng)跑到底)。現(xiàn)在大多數(shù) Coding Agent harness 基本分兩種模式:要么 agent 想干嘛就干嘛,要么每一步都要問你:“你確定要?jiǎng)h這個(gè)文件嗎?”“你確定要列出這個(gè)目錄嗎?”……看似安全,但現(xiàn)實(shí)是,這種機(jī)制只會(huì)帶來疲勞。用戶要么直接關(guān)掉這些確認(rèn),開啟 YOLO 模式,要么就無腦按回車,根本不會(huì)看提示。所以這并不是一個(gè)真正有效的解決方案。
至于 containerization(容器化),如果你擔(dān)心數(shù)據(jù)泄露或提示詞注入,它也不是萬能解。但相比那些確認(rèn)對話框式的“guardrail(護(hù)欄)”,它至少是一個(gè)更合理的基礎(chǔ)。
pi 只提供四個(gè)工具:read、write、edit,以及 bash。沒有 MCP,沒有 sub-agents,沒有 plan mode,沒有 background bash,也沒有內(nèi)置的 to-do 系統(tǒng)。但重點(diǎn)在于,你完全可以用更簡單、更透明的方式自己實(shí)現(xiàn)這些。
![]()
沒有 MCP?可以用 CLI tools 加上 skills,或者直接寫一個(gè) extension,一天之內(nèi)就能搞定。沒有 sub-agents?因?yàn)樗鼈儾豢捎^察。你可以用 tmux 去 spawn agent,這樣所有輸入輸出都在你掌控之中,每一步發(fā)生了什么都一清二楚。現(xiàn)在 Claude Code 的 team mode,本質(zhì)上也在做類似的事情。
沒有 plan mode?那就寫一個(gè) plan.md 文件。它是一個(gè)持久化的 artifact,比那些塞不進(jìn) terminal viewport 的“蹩腳 UI”實(shí)用多了,而且還能跨 session 復(fù)用。沒有 background bash?tmux 已經(jīng)幫你解決了。沒有內(nèi)置 to-dos?寫一個(gè) todo.md 就行。
當(dāng)然,你也可以選擇把這些全部按自己的方式重新實(shí)現(xiàn),這正是 pi 的價(jià)值所在:極致的可擴(kuò)展性。你可以擴(kuò)展工具,給 LLM 提供你自己定義的能力。目前幾乎沒有其他 Coding Agent harness 支持這一點(diǎn),除非你去 fork OpenCode。但在 pi 里,你只需要寫一個(gè)簡單的 TypeScript 文件,它就會(huì)自動(dòng)加載。
你還可以寫自定義 UI、skills、prompt templates、themes,然后打包發(fā)布到 npm 或 git,通過一條命令安裝。更關(guān)鍵的是,所有東西都支持 hot reload。我平時(shí)會(huì)在項(xiàng)目內(nèi)部開發(fā)一些 task-specific 的 extension,當(dāng) agent 修改這些 extension 后,我只需要 reload,一切就即時(shí)生效,整個(gè)運(yùn)行中的系統(tǒng)會(huì)立刻更新,體驗(yàn)非常順滑。
這在實(shí)踐中意味著很多事情都可以自己動(dòng)手做。比如 custom compaction,這是我覺得大家應(yīng)該多嘗試的方向,現(xiàn)在所有的 compaction 實(shí)現(xiàn)都不太理想。permission gates?50 行代碼就能寫一個(gè),覆蓋市面上大多數(shù) agent harness 的能力。custom providers?無論是注冊 proxy 還是接 self-hosted models,都不用等我來做,你自己甚至可以讓 clanker 幫你寫。
你甚至可以重寫內(nèi)置工具,改變 read、edit、bash 的行為。我自己就有一套版本,是通過 SSH 在遠(yuǎn)程機(jī)器上執(zhí)行的,5 分鐘就實(shí)現(xiàn)了,而且很好用。再加上完整的 TUI 訪問能力,你可以在 Coding Agent 里直接構(gòu)建完全自定義的界面。
![]()
社區(qū)里已經(jīng)有不少有趣的 extension。比如有人用 5 分鐘就在 pi 里復(fù)刻了 Claude Code ships,而且功能更多。
![]()
pi-messenger,是多個(gè) pi agent 的聊天室,它們可以互相通信,還有自定義 UI,可以實(shí)時(shí)觀察它們的行為,而且確實(shí)能跑。
![]()
甚至還有一些更“離譜”的玩法,比如 pi-nes,你可以在 agent 運(yùn)行的時(shí)候順手打個(gè)游戲。
![]()
pi-annotate,可以直接打開你正在開發(fā)的網(wǎng)站,在前端界面上做標(biāo)注,把反饋原地喂回給 agent,再讓它修改代碼。
![]()
還有我自己常用的 pi-files-widget,不用切到 IDE,就能快速查看剛剛被修改的文件。
關(guān)鍵在于,這些都不是內(nèi)置功能,全都是 extension。而大多數(shù)人只需要幾分鐘到一個(gè)下午,就能把這些東西按自己的習(xí)慣搭出來。
![]()
pi 的 session 是樹結(jié)構(gòu),而不是線性的聊天記錄。你可以在一個(gè)分支里讓 agent 讀取目錄、總結(jié)內(nèi)容,然后回到主對話,把總結(jié)帶回來繼續(xù)工作,本質(zhì)上就是一種更可控的 sub-agent。系統(tǒng)不會(huì)在你背后偷偷注入任何東西,agent、skills、調(diào)用成本,全都是透明可追蹤的。這一點(diǎn)很多 harness 都沒做好。此外還支持 HTML 導(dǎo)出、JSON 格式、headless JSON streaming 等等。
Pi 真的有用嗎?terminal bench 的結(jié)果顯示:pi 緊跟在 Terminus 2 后面,使用的是 Claude Opus 4.5。而那還是在去年 10 月,當(dāng)時(shí) pi 甚至還沒有 compaction。
最后說一點(diǎn)現(xiàn)實(shí)問題。如果你參與這個(gè)項(xiàng)目,很可能會(huì)有大量來自 OpenClaw 的用戶涌進(jìn)你的倉庫,用 clanker 批量提交 issue 和 PR,直接把你淹沒。
所以我不得不搞了一些“防御機(jī)制”。比如我發(fā)明了一個(gè)叫 OSS Vacation 的策略:直接把 issue 和 PR 關(guān)掉幾周,自己專心開發(fā)。真正重要的問題,總會(huì)有人在之后重新提出來,或者在 Discord 里說。
另外我還做了一個(gè)簡單的訪問控制:倉庫里有一個(gè) markdown 文件,如果有人提交 PR,但用戶名不在這個(gè)文件里,PR 會(huì)被自動(dòng)關(guān)閉。規(guī)則也很簡單,先用“人類的聲音”寫一個(gè) issue,自我介紹一下,而且不要超過一屏,因?yàn)樘L的大概率是 clanker 寫的。通過之后,你的名字會(huì)被加入列表,就可以正常提 PR 了。本質(zhì)上,我只是在做一件事:驗(yàn)證你是人類。
后來 Ghostty 的 Mitchell 也基于這個(gè)思路做了一個(gè)項(xiàng)目,叫 vouch,可以更方便地應(yīng)用在你自己的開源倉庫里。
以上就是 pi,去試試吧。
演講原鏈接:
https://www.youtube.com/watch?v=Dli5slNaJu0
聲明:本文為 InfoQ 翻譯整理,不代表平臺觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。
會(huì)議推薦
世界模型的下一個(gè)突破在哪?Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發(fā)體系不重構(gòu),還能撐多久?
AICon 上海站 2026,4 大核心專題等你來:世界模型與多模態(tài)智能突破、Agent 架構(gòu)與工程化實(shí)踐、Agent 安全與可信治理、企業(yè)級研發(fā)體系重構(gòu)。14 個(gè)專題全面開放征稿。
誠摯邀請你登臺分享實(shí)戰(zhàn)經(jīng)驗(yàn)。AICon 2026,期待與你同行。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.