<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      寫了 17 年開源代碼,我為什么認(rèn)為 Coding Agents 堆功能是在瞎折騰?

      0
      分享至


      編譯 | 宇琪

      策劃 | Tina

      在 AI 編程工具進(jìn)入大亂斗時(shí)代的今天,我們似乎已經(jīng)習(xí)慣了各種功能的堆疊。但在 libGDX 創(chuàng)始人、17 年開源老兵 Mario Zechner 眼中,這一切正變得越來越不可控。

      “當(dāng)你發(fā)現(xiàn) AI 在背地里偷偷修改你的上下文,而你卻對此一無所知時(shí),這種掌控感的喪失是極其危險(xiǎn)的。”

      近日,在 Tessel 舉辦的開發(fā)者大會(huì)上,Mario 不僅公開吐槽了 Claude Code、OpenCode,更帶出了他的極簡主義“反叛之作”——pi。這是一個(gè)只有 read、write、edit、bash 四種工具,擁有主流 agent 里最短的 system prompt,卻有著極致的可擴(kuò)展性、能讓開發(fā)者重拾掌控權(quán)的終端編程 agent。

      本文基于該演講視頻整理,經(jīng) InfoQ 編輯。

      核心觀點(diǎn)如下:

      • Claude Code 現(xiàn)在就是一架宇宙飛船,它功能多到你可能只用過其中的 5%,了解的也就 10%,剩下 90% 全是 AI 和 agents 領(lǐng)域的“暗物質(zhì)”,沒人知道它背地里到底在干嘛。

      • 現(xiàn)有的編程框架里,很多功能可能并不是獲得好結(jié)果的必需品。不需要文件工具,不需要子 agent,不需要聯(lián)網(wǎng)搜素,啥都不需要。

      • 我們現(xiàn)在正處于“一邊瞎折騰一邊看結(jié)果”的階段,沒人知道完美的編程 agent 到底該長啥樣。我們需要更好的“折騰”方式,編程 agent 必須是可自修改、可塑性極強(qiáng)的,這樣我們才能快速實(shí)驗(yàn)新想法,看看能不能折騰出某種新的行業(yè)標(biāo)準(zhǔn)或 workflow。

      • 真正需要 linting 和類型檢查的時(shí)機(jī)只有一個(gè):那就是 agent 覺得自己徹底完活兒的時(shí)候。

      1ChatGPT→Copilot→Aider→Claude Code

      2025 年 4 月左右,Peter Steinberger(OpenClaw 創(chuàng)始人)跑來跟我還有 Armin Ronacher(Sentry 聯(lián)合創(chuàng)始人、Flask Web 框架創(chuàng)建者)說:“現(xiàn)在的 Coding Agents 真的進(jìn)化到能干活的程度了。” 我當(dāng)時(shí)的第一反應(yīng)是:“噢,快給我閉嘴吧!”我是真不信這玩意兒。但一個(gè)月后,我們幾個(gè)就在公寓里閉關(guān)了 24 小時(shí),整夜沉浸在這些 clankers、wipe coat 和 wipe slop 的世界里。

      我們不停地造東西,造了一大堆,但絕大多數(shù)我們自己從來沒用過。這就是 2025 到 2026 年的新常態(tài):我們寫了很多代碼,造了很多輪子,但真正用上的沒幾個(gè)。折騰到最后我開始想,我討厭現(xiàn)有的所有 Coding Agents 或開發(fā)框架,自己寫一個(gè)到底能有多難?當(dāng)時(shí) Peter 說:“我只想做一個(gè)屬于自己的小玩意兒。”后來的故事大家可能都知道了。

      今天,我要講的是我那個(gè)沒那么驚天動(dòng)地的故事,但我希望能在其中分享一些我在過去幾個(gè)月里攢下的行業(yè)洞察。

      先聊聊 Coding Agents 的演進(jìn)史。

      2025 年之前的情況基本就是:從 ChatGPT 搬運(yùn)代碼,但代碼大多是碎的,通常只能寫一些你不想親自動(dòng)手的簡單函數(shù)。然后有了集成在 Visual Studio Code 里的 GitHub Copilot,只需要一路 tap tap tap,雖然有時(shí)候靈,大多數(shù)時(shí)候并不。甚至有時(shí)候,它還會(huì)非常“貼心”地給你默寫一段 GPL 協(xié)議的代碼,比如 John Carmack 的那個(gè)平方根倒數(shù)速算法之類的。后來又有了 Aider,當(dāng)時(shí)還有 AutoGPT。

      最后,Claude Code 登場了。我記得他們在 2024 年 11 月發(fā)布了 beta 版,但真正火起來是在 2025 年 2 月或 3 月的樣子。當(dāng)時(shí)我覺得這玩意兒簡直太棒了,Claude 團(tuán)隊(duì)非常出色,他們在社交媒體上很活躍,人也都很天才。

      說實(shí)話,他們基本上開創(chuàng)了整個(gè)品類。雖然之前有 Aider 和 AutoGPT 鋪路,但沒有一個(gè)能達(dá)到這種高度。這就是所謂的 agentic search(智能體搜索)范式:它不像 Cursor 那樣先進(jìn)入你的 codebase 做索引、搞各種復(fù)雜的構(gòu)建(雖然那樣搞也未必好使)。Claude 團(tuán)隊(duì)直接通過強(qiáng)化訓(xùn)練,讓模型學(xué)會(huì)使用文件工具和 bash 工具,通過這種方式實(shí)時(shí)探索你的 codebase,尋找理解代碼所需的信息并直接修改。這效果簡直驚人,我們直接不睡覺了,因?yàn)楫a(chǎn)出的代碼量比以前純手寫翻了不知道多少倍。

      那時(shí)候它簡單、可預(yù)測,完美契合我的 workflow。但后來,他們掉進(jìn)了一個(gè)我們很多人都會(huì)掉進(jìn)去的陷阱:既然這些 clankers 能寫這么多代碼,為什么不讓它把所有能想到的 feature 都寫了呢?這主意聽起來不錯(cuò)吧?咱們加這個(gè)功能,加那個(gè)功能,加加加……最后搞出了一個(gè)類似 Homer Simpson 設(shè)計(jì)的那種怪物。Claude Code 現(xiàn)在就是一架宇宙飛船,它功能多到你可能只用過其中的 5%,了解的也就 10%,剩下 90% 全是 AI 和 agents 領(lǐng)域的“暗物質(zhì)”,沒人知道它背地里到底在干嘛。

      2Claude Code 不是一個(gè)穩(wěn)定的好工具

      我個(gè)人覺得這并沒什么用,因?yàn)槲沂冀K認(rèn)為開發(fā)者需要知道 agent 到底在做什么。我們現(xiàn)在在 Tessel 的活動(dòng)現(xiàn)場,他們也喜歡搞 context management/engineering。但我最終發(fā)現(xiàn),Claude Code 在可觀測性和上下文管理方面并不是一個(gè)好工具。而且,誰受得了 Claude Code 的那種沒完沒了的、莫名其妙的閃爍?


      Anthropic 的開發(fā)者關(guān)系專家 Thariq Shihipar 有時(shí)候會(huì)在 Twitter 上說些讓人摸不著頭腦的話,比如:“我們的 terminal user interface 現(xiàn)在是一個(gè)游戲引擎了。”

      我是做游戲開發(fā)出身的,那是我的老本行。當(dāng)我看到這種話時(shí),心真的會(huì)滴血。那只是個(gè)終端界面,你之所以覺得它是游戲引擎,是因?yàn)槟阍诮K端界面里用了 React,結(jié)果導(dǎo)致重新渲染整個(gè) UI 樹要花掉 12 毫秒。別這么干好嗎?它真不是游戲引擎。


      后來寫 Ghostty 的 Mitchell 也忍不住了,他說:“這聽起來有點(diǎn)冒犯。別把鍋甩給 Ghostty 或者其他終端,純粹是因?yàn)槟愕拇a太爛了。”終端渲染一幀只需要不到 1 毫秒,每秒能跑幾百幀,所以別拿這個(gè)當(dāng)借口。


      雖然后來他們修好了閃爍,但別的問題接踵而至。你會(huì)感覺到他們徹底倒向了所謂的 vibe coding,這種感覺在你每天使用 Claude Code 時(shí)尤為明顯。我并不是要貶低他們的努力和成果,Claude Code 依然是這個(gè)品類的領(lǐng)頭羊,他們開創(chuàng)了這一切且做得非常棒。我只是個(gè)喜歡簡單、可預(yù)測工具的老頭子,而它已經(jīng)不再契合我的 workflow 和需求了。

      而且,他們在后臺偷偷對你的 context 做了很多手腳。2025 年夏天,我寫了一堆工具去攔截 Claude Code 發(fā)往后端的請求,想看看他們在背地里往我的 context 里塞了哪些額外的文字。結(jié)果發(fā)現(xiàn)這些操作非常多余,而且每天都在變。可能今天發(fā)個(gè)版本,明天又發(fā)個(gè)版本,注入內(nèi)容的時(shí)機(jī)和方式變來變?nèi)ィ@會(huì)直接搞亂你現(xiàn)有的 workflow。它不是一個(gè)穩(wěn)定的工具。

      我理解他們的立場,他們需要實(shí)驗(yàn),而且用戶基數(shù)巨大,在龐大用戶群的基礎(chǔ)上做實(shí)驗(yàn)確實(shí)很難。但他們并不在意用戶的感受,所以我們都得跟著受罪:你正用著這個(gè)新工具,努力構(gòu)建可預(yù)測的 workflow,然后工具廠商在引擎蓋下改了個(gè)不起眼的小細(xì)節(jié),就導(dǎo)致 LLM 在處理你現(xiàn)有任務(wù)時(shí)直接發(fā)瘋。這根本沒法持續(xù),我需要掌控感,我不能指望他們給我提供一個(gè)所謂的“穩(wěn)定環(huán)境”。

      作為 UI 設(shè)計(jì)的代價(jià),他們不得不降低可觀測性。我個(gè)人不喜歡這樣,但這只是個(gè)人偏好,我知道大多數(shù)人對于 Claude Code 展示的信息量已經(jīng)很滿意了。另外,它顯然沒有模型選擇權(quán),因?yàn)樗?Anthropic 的原生工具。這不算壞處,但它幾乎沒有任何擴(kuò)展性。雖然他們有一套 hook 系統(tǒng),但如果你對比一下 pi 能實(shí)現(xiàn)的功能,你會(huì)發(fā)現(xiàn)他們的集成度并不深。而且它基本是基于在 hook 事件觸發(fā)時(shí)運(yùn)行一個(gè)進(jìn)程,如果你需要反復(fù)啟動(dòng)那個(gè)進(jìn)程,開銷真的非常昂貴。

      后來,我徹底對 Claude Code 下頭了。倒不是說它做得爛,只是它不再適合我了。在那段時(shí)間里,它變得適合更多的大眾用戶,這說明他們路子走對了,只是不適合我這種老古董。

      3OpenCode 的底層設(shè)計(jì)讓我失去信心

      于是我開始到處找替代方案。首先是 Codex CLI,剛開始我挺不喜歡它的,無論是界面還是模型,不過現(xiàn)在它的模型表現(xiàn)確實(shí)挺驚艷的。接著是 AMP,這個(gè)團(tuán)隊(duì)的核心成員以前在 Sourcegraph 工作,后來出來單干了,都是極其頂尖的工程師。他們居然做出了一款非常商業(yè)化的 coding harness,而且是靠“砍功能”而不是“堆功能”來贏得市場,他們的很多設(shè)計(jì)邏輯跟我簡直不謀而合。如果你想要個(gè)商業(yè)化的編程框架,我絕對推薦 AMP。Factory 也是類似的思路,做得很扎實(shí),只是沒像 AMP 那么激進(jìn)和富有實(shí)驗(yàn)精神。

      然后就是 OpenCode 了,很多人都在用的開源框架。我這人有開源情懷,在開源圈摸爬滾打了 17 年,大大小小的項(xiàng)目都管過,開源對我來說意義非凡。所以我當(dāng)時(shí)想,既然 OpenCode 離我這么近,那就試試吧。而且說實(shí)話,除了 AMP,OpenCode 的團(tuán)隊(duì)是這個(gè)圈子里最接地氣、最務(wù)實(shí)的,他們不會(huì)整天拿那些你八輩子用不上的功能來忽悠你,而是努力維持一個(gè)非常穩(wěn)定的核心體驗(yàn)。他們對“編程 agent 對我們職業(yè)意味著什么”的思考,我也非常認(rèn)同。

      但 OpenCode 的問題在于:它在上下文管理上做得一塌糊涂。比如,它每一輪對話都會(huì)調(diào)用一個(gè)叫 SessionCompaction.prune 的函數(shù),把最后 4 萬個(gè) token 之前的記錄全給刪了。大家應(yīng)該都知道 prompt caching(提示詞緩存)吧?它這么干意味著把你的 cache 全毀了。

      OpenCode 和 Anthropic 之間有一段挺有意思的過節(jié)。在我看來,Anthropic 后來的態(tài)度邏輯很通順:“你們不能這么搞。”雖然這事兒沒公開鬧大,但道理很簡單:如果你去健身房卻不守規(guī)矩,濫用人家的基礎(chǔ)設(shè)施,你肯定會(huì)被拉黑。雖然我沒證據(jù),但我猜這就是為什么 Anthropic 和 OpenCode 之間關(guān)系緊張的原因。我完全站在 Anthropic 這邊,別去糟蹋人家的基礎(chǔ)設(shè)施。

      還有些別的坑,比如 OpenCode 自帶了 LSP(語言服務(wù)器協(xié)議)支持。假設(shè)你給 agent 下了個(gè)任務(wù),讓它改一堆文件。實(shí)際操作中它會(huì)怎么干?它會(huì)一個(gè)接一個(gè)地改。你覺得它改完第一輪,代碼能編譯通過的概率有多大?當(dāng)你一行一行改代碼時(shí),得花多久才能讓它重新回到編譯通過的狀態(tài)?答案是根本回不去。可能改完第一處、第二處,代碼還是崩的。

      這時(shí)候如果你跑去問 LSP 服務(wù):“嘿,我剛改了這一行,代碼崩了嗎?”LSP 肯定會(huì)說:“是的,徹底崩了。”然后這個(gè)功能就會(huì)把報(bào)錯(cuò)信息直接塞進(jìn) tool call 后面,反饋給模型:“你剛才干錯(cuò)了。”模型一臉懵逼:“搞什么?我還沒改完呢!你現(xiàn)在跟我說這個(gè)?”這種事發(fā)生得多了,模型最后就會(huì)直接罷工,導(dǎo)致產(chǎn)出的結(jié)果非常糟糕。所以我特別反感在 agent 工作時(shí)掛 LSP。真正需要 linting(代碼檢查)和類型檢查的時(shí)機(jī)只有一個(gè):那就是 agent 覺得自己徹底完活兒的時(shí)候。

      而且 OpenCode 最近有個(gè)變化:在一個(gè) session 里,每一條消息居然都會(huì)被保存為一個(gè)獨(dú)立的 JSON 文件。這在我看來,說明它在整個(gè)架構(gòu)設(shè)計(jì)上缺乏深度思考。一旦我對這種底層設(shè)計(jì)失去信心,我就不想再用這個(gè)工具了。

      此外,OpenCode 默認(rèn)帶了一個(gè) server 架構(gòu),客戶端連接到服務(wù)端,終端界面只是其中一個(gè)客戶端。這原本挺高端,結(jié)果卻爆出了一個(gè)默認(rèn)自帶的遠(yuǎn)程代碼執(zhí)行(RCE)安全漏洞。如果你對自己的服務(wù)器架構(gòu)那么自豪,我默認(rèn)你應(yīng)該是一群成熟的工程師,至少考慮過安全性吧?但顯然他們沒考慮,而且這個(gè)洞開了很久。我也不是要指責(zé)誰,在現(xiàn)在這種前所未有的、快到讓人頸椎骨折的行業(yè)節(jié)奏下,出錯(cuò)難免,但我是不想用這種存在隱患的工具。

      這就是我對現(xiàn)有 coding harnesses 的觀察。AMP 其實(shí)不錯(cuò),但我沒有掌控權(quán),它甚至?xí)Q定你用哪個(gè)模型處理哪類任務(wù),這不符合我的性格。

      后來因?yàn)橐恍﹦e的原因,我開始研究 Benchmark(基準(zhǔn)測試),結(jié)果發(fā)現(xiàn)了 TerminalBench。簡單來說,它是一個(gè)專門針對 agent 的評估 harness,包含了大量和計(jì)算機(jī)操作、編程相關(guān)的任務(wù)。它有大約 82 個(gè)非常多樣化的任務(wù),從“修好我的 Windows 設(shè)置”到“幫我寫一個(gè)蒙特卡洛模擬”。它有個(gè)排行榜,上面列出了各種 agent 框架和模型的組合。

      其中有一個(gè)叫 Terminus 的 agent 讓我覺得非常驚艷,它是排行榜上表現(xiàn)最好的框架之一。它是怎么做的呢?模型拿到的只有一個(gè) tmux session,它唯一能做的就是發(fā)送按鍵,然后讀取返回的 VT 序列碼。這是模型和電腦之間最極簡、最原始的接口了。然而,它的表現(xiàn)卻是頂級的。

      這說明了什么?我們真的需要那些花里胡哨的功能來讓模型干活嗎?

      對我個(gè)人而言,這不只是模型好不好的問題,還有作為用戶的“人”該如何與 agent 交互。Terminus 的用戶體驗(yàn)或開發(fā)者體驗(yàn)顯然不是我想要的,但它證明了一點(diǎn):現(xiàn)有的編程框架里,很多功能可能并不是獲得好結(jié)果的必需品。不需要文件工具,不需要子 agent,不需要聯(lián)網(wǎng)搜素,啥都不需要。

      基于這些發(fā)現(xiàn),我總結(jié)了兩個(gè)核心論點(diǎn):第一,我們現(xiàn)在正處于“一邊瞎折騰一邊看結(jié)果”的階段,沒人知道完美的編程 agent 到底該長啥樣。大家都在嘗試,有人走極簡路線,有人走“宇宙飛船”路線,搞什么 agent 集群、完全自治。我覺得這事兒還沒定論,行業(yè)標(biāo)準(zhǔn)還沒出現(xiàn)。

      第二,我們需要更好的“折騰”方式,編程 agent 必須是可自修改、可塑性極強(qiáng)的,這樣我們才能快速實(shí)驗(yàn)新想法,看看能不能折騰出某種新的行業(yè)標(biāo)準(zhǔn)或 workflow。

      所以我的基本思路非常簡單:剝離掉一切冗余,構(gòu)建一個(gè)極簡且可擴(kuò)展的核心,再稍微加點(diǎn)讓人用著舒服的小功能。它不是一張純粹的白紙,但也絕對不臃腫。

      4Pi:讓 Coding Agent 適應(yīng)你的需求

      pi 的核心理念很簡單:讓你的 Coding Agent 去適應(yīng)你的需求,而不是反過來。


      整個(gè)系統(tǒng)只由四個(gè) package 組成。首先是 AI package,本質(zhì)上是對多種 provider 的一個(gè)輕量抽象層。因?yàn)椴煌?provider 使用不同的 transport protocol,這一層幫你把復(fù)雜性都抹平了。你可以在同一個(gè) context 或 session 里非常輕松地和不同 provider 對話、隨時(shí)切換。接下來是 agent core,一個(gè)通用的 agent loop,包含 tooling、定位、驗(yàn)證等等基礎(chǔ)能力。然后是 TUI,大概只有 600 行代碼,但出奇地好用,可能因?yàn)椴皇悄硞€(gè) clanker 寫的。最后是 Coding Agent 本身,它既可以作為一個(gè) SDK,在 headless 模式下使用,也可以作為一個(gè)完整的終端交互式 Coding Agent。


      系統(tǒng) prompt 就這么多,全部都在這了。和其他 coding harness 那種動(dòng)輒一大堆 token 的 system prompt 相比,這里幾乎是“空”的。原因其實(shí)很直白:frontier models 已經(jīng)通過大量 RL 訓(xùn)練,早就“知道”什么是 Coding Agent 了。所以反復(fù)告訴它“你是一個(gè) Coding Agent”“你應(yīng)該怎么寫代碼”?其實(shí)沒有必要。

      默認(rèn)就是 YOLO 模式(默認(rèn)直接執(zhí)行,不向用戶確認(rèn),全自動(dòng)跑到底)。現(xiàn)在大多數(shù) Coding Agent harness 基本分兩種模式:要么 agent 想干嘛就干嘛,要么每一步都要問你:“你確定要?jiǎng)h這個(gè)文件嗎?”“你確定要列出這個(gè)目錄嗎?”……看似安全,但現(xiàn)實(shí)是,這種機(jī)制只會(huì)帶來疲勞。用戶要么直接關(guān)掉這些確認(rèn),開啟 YOLO 模式,要么就無腦按回車,根本不會(huì)看提示。所以這并不是一個(gè)真正有效的解決方案。

      至于 containerization(容器化),如果你擔(dān)心數(shù)據(jù)泄露或提示詞注入,它也不是萬能解。但相比那些確認(rèn)對話框式的“guardrail(護(hù)欄)”,它至少是一個(gè)更合理的基礎(chǔ)。

      pi 只提供四個(gè)工具:read、write、edit,以及 bash。沒有 MCP,沒有 sub-agents,沒有 plan mode,沒有 background bash,也沒有內(nèi)置的 to-do 系統(tǒng)。但重點(diǎn)在于,你完全可以用更簡單、更透明的方式自己實(shí)現(xiàn)這些。


      沒有 MCP?可以用 CLI tools 加上 skills,或者直接寫一個(gè) extension,一天之內(nèi)就能搞定。沒有 sub-agents?因?yàn)樗鼈儾豢捎^察。你可以用 tmux 去 spawn agent,這樣所有輸入輸出都在你掌控之中,每一步發(fā)生了什么都一清二楚。現(xiàn)在 Claude Code 的 team mode,本質(zhì)上也在做類似的事情。

      沒有 plan mode?那就寫一個(gè) plan.md 文件。它是一個(gè)持久化的 artifact,比那些塞不進(jìn) terminal viewport 的“蹩腳 UI”實(shí)用多了,而且還能跨 session 復(fù)用。沒有 background bash?tmux 已經(jīng)幫你解決了。沒有內(nèi)置 to-dos?寫一個(gè) todo.md 就行。

      當(dāng)然,你也可以選擇把這些全部按自己的方式重新實(shí)現(xiàn),這正是 pi 的價(jià)值所在:極致的可擴(kuò)展性。你可以擴(kuò)展工具,給 LLM 提供你自己定義的能力。目前幾乎沒有其他 Coding Agent harness 支持這一點(diǎn),除非你去 fork OpenCode。但在 pi 里,你只需要寫一個(gè)簡單的 TypeScript 文件,它就會(huì)自動(dòng)加載。

      你還可以寫自定義 UI、skills、prompt templates、themes,然后打包發(fā)布到 npm 或 git,通過一條命令安裝。更關(guān)鍵的是,所有東西都支持 hot reload。我平時(shí)會(huì)在項(xiàng)目內(nèi)部開發(fā)一些 task-specific 的 extension,當(dāng) agent 修改這些 extension 后,我只需要 reload,一切就即時(shí)生效,整個(gè)運(yùn)行中的系統(tǒng)會(huì)立刻更新,體驗(yàn)非常順滑。

      這在實(shí)踐中意味著很多事情都可以自己動(dòng)手做。比如 custom compaction,這是我覺得大家應(yīng)該多嘗試的方向,現(xiàn)在所有的 compaction 實(shí)現(xiàn)都不太理想。permission gates?50 行代碼就能寫一個(gè),覆蓋市面上大多數(shù) agent harness 的能力。custom providers?無論是注冊 proxy 還是接 self-hosted models,都不用等我來做,你自己甚至可以讓 clanker 幫你寫。

      你甚至可以重寫內(nèi)置工具,改變 read、edit、bash 的行為。我自己就有一套版本,是通過 SSH 在遠(yuǎn)程機(jī)器上執(zhí)行的,5 分鐘就實(shí)現(xiàn)了,而且很好用。再加上完整的 TUI 訪問能力,你可以在 Coding Agent 里直接構(gòu)建完全自定義的界面。


      社區(qū)里已經(jīng)有不少有趣的 extension。比如有人用 5 分鐘就在 pi 里復(fù)刻了 Claude Code ships,而且功能更多。


      pi-messenger,是多個(gè) pi agent 的聊天室,它們可以互相通信,還有自定義 UI,可以實(shí)時(shí)觀察它們的行為,而且確實(shí)能跑。


      甚至還有一些更“離譜”的玩法,比如 pi-nes,你可以在 agent 運(yùn)行的時(shí)候順手打個(gè)游戲。


      pi-annotate,可以直接打開你正在開發(fā)的網(wǎng)站,在前端界面上做標(biāo)注,把反饋原地喂回給 agent,再讓它修改代碼。


      還有我自己常用的 pi-files-widget,不用切到 IDE,就能快速查看剛剛被修改的文件。

      關(guān)鍵在于,這些都不是內(nèi)置功能,全都是 extension。而大多數(shù)人只需要幾分鐘到一個(gè)下午,就能把這些東西按自己的習(xí)慣搭出來。


      pi 的 session 是樹結(jié)構(gòu),而不是線性的聊天記錄。你可以在一個(gè)分支里讓 agent 讀取目錄、總結(jié)內(nèi)容,然后回到主對話,把總結(jié)帶回來繼續(xù)工作,本質(zhì)上就是一種更可控的 sub-agent。系統(tǒng)不會(huì)在你背后偷偷注入任何東西,agent、skills、調(diào)用成本,全都是透明可追蹤的。這一點(diǎn)很多 harness 都沒做好。此外還支持 HTML 導(dǎo)出、JSON 格式、headless JSON streaming 等等。

      Pi 真的有用嗎?terminal bench 的結(jié)果顯示:pi 緊跟在 Terminus 2 后面,使用的是 Claude Opus 4.5。而那還是在去年 10 月,當(dāng)時(shí) pi 甚至還沒有 compaction。

      最后說一點(diǎn)現(xiàn)實(shí)問題。如果你參與這個(gè)項(xiàng)目,很可能會(huì)有大量來自 OpenClaw 的用戶涌進(jìn)你的倉庫,用 clanker 批量提交 issue 和 PR,直接把你淹沒。

      所以我不得不搞了一些“防御機(jī)制”。比如我發(fā)明了一個(gè)叫 OSS Vacation 的策略:直接把 issue 和 PR 關(guān)掉幾周,自己專心開發(fā)。真正重要的問題,總會(huì)有人在之后重新提出來,或者在 Discord 里說。

      另外我還做了一個(gè)簡單的訪問控制:倉庫里有一個(gè) markdown 文件,如果有人提交 PR,但用戶名不在這個(gè)文件里,PR 會(huì)被自動(dòng)關(guān)閉。規(guī)則也很簡單,先用“人類的聲音”寫一個(gè) issue,自我介紹一下,而且不要超過一屏,因?yàn)樘L的大概率是 clanker 寫的。通過之后,你的名字會(huì)被加入列表,就可以正常提 PR 了。本質(zhì)上,我只是在做一件事:驗(yàn)證你是人類。

      后來 Ghostty 的 Mitchell 也基于這個(gè)思路做了一個(gè)項(xiàng)目,叫 vouch,可以更方便地應(yīng)用在你自己的開源倉庫里。

      以上就是 pi,去試試吧。

      演講原鏈接:

      https://www.youtube.com/watch?v=Dli5slNaJu0

      聲明:本文為 InfoQ 翻譯整理,不代表平臺觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。

      會(huì)議推薦

      世界模型的下一個(gè)突破在哪?Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發(fā)體系不重構(gòu),還能撐多久?

      AICon 上海站 2026,4 大核心專題等你來:世界模型與多模態(tài)智能突破、Agent 架構(gòu)與工程化實(shí)踐、Agent 安全與可信治理、企業(yè)級研發(fā)體系重構(gòu)。14 個(gè)專題全面開放征稿。

      誠摯邀請你登臺分享實(shí)戰(zhàn)經(jīng)驗(yàn)。AICon 2026,期待與你同行。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      4戰(zhàn)國乒吞0-12!法國男團(tuán)放話:中國隊(duì)已不可怕 我們將首次贏他們

      4戰(zhàn)國乒吞0-12!法國男團(tuán)放話:中國隊(duì)已不可怕 我們將首次贏他們

      風(fēng)過鄉(xiāng)
      2026-05-09 17:29:03
      商務(wù)部:中俄貿(mào)易連續(xù)三年突破2000億美元

      商務(wù)部:中俄貿(mào)易連續(xù)三年突破2000億美元

      界面新聞
      2026-05-09 10:17:43
      皮皮蝦事件博主陳女士相關(guān)信息被扒,網(wǎng)友又開始網(wǎng)暴她了

      皮皮蝦事件博主陳女士相關(guān)信息被扒,網(wǎng)友又開始網(wǎng)暴她了

      映射生活的身影
      2026-05-09 10:45:43
      京粵大戰(zhàn)1-1戰(zhàn)平!于嘉賽后犀利點(diǎn)評:差距在氣質(zhì),輸贏看硬核!

      京粵大戰(zhàn)1-1戰(zhàn)平!于嘉賽后犀利點(diǎn)評:差距在氣質(zhì),輸贏看硬核!

      田先生籃球
      2026-05-09 22:37:18
      U17國足兩連敗!亞洲杯3戰(zhàn)日本全負(fù),仍有晉級可能,延續(xù)3魔咒

      U17國足兩連敗!亞洲杯3戰(zhàn)日本全負(fù),仍有晉級可能,延續(xù)3魔咒

      奧拜爾
      2026-05-10 01:54:09
      原廣州軍區(qū)副司令員兼南海艦隊(duì)司令員王永國逝世,享年87歲

      原廣州軍區(qū)副司令員兼南海艦隊(duì)司令員王永國逝世,享年87歲

      澎湃新聞
      2026-05-09 12:08:29
      深度長文:為什么生物不朝著永生演化,反而執(zhí)著于繁衍?

      深度長文:為什么生物不朝著永生演化,反而執(zhí)著于繁衍?

      宇宙時(shí)空
      2026-05-07 17:15:49
      “尋天”商標(biāo)注冊!小米欲成立汽車獨(dú)立子品牌?官方未作回應(yīng)

      “尋天”商標(biāo)注冊!小米欲成立汽車獨(dú)立子品牌?官方未作回應(yīng)

      每日經(jīng)濟(jì)新聞
      2026-05-09 19:47:07
      張皓嘉三分絕殺,誰注意趙睿?下意識不防,賽后開心祝賀其絕殺!

      張皓嘉三分絕殺,誰注意趙睿?下意識不防,賽后開心祝賀其絕殺!

      籃球資訊達(dá)人
      2026-05-10 00:14:53
      李澤楷做錯(cuò)了?香港拿下世界杯轉(zhuǎn)播權(quán),官媒銳評:給內(nèi)地談判底氣

      李澤楷做錯(cuò)了?香港拿下世界杯轉(zhuǎn)播權(quán),官媒銳評:給內(nèi)地談判底氣

      好賢觀史記
      2026-05-09 18:00:07
      黃瓜立大功?醫(yī)生發(fā)現(xiàn):經(jīng)常吃黃瓜的人,不出半年,或有4大改善

      黃瓜立大功?醫(yī)生發(fā)現(xiàn):經(jīng)常吃黃瓜的人,不出半年,或有4大改善

      芹姐說生活
      2026-05-09 21:08:03
      演員文章酒吧開業(yè),繼面館大火之后又一產(chǎn)業(yè),本人透露:初衷是想給自己一個(gè)吃飯喝酒的地方;當(dāng)天其母親和圈內(nèi)好友劉威、劉歡等到場助陣

      演員文章酒吧開業(yè),繼面館大火之后又一產(chǎn)業(yè),本人透露:初衷是想給自己一個(gè)吃飯喝酒的地方;當(dāng)天其母親和圈內(nèi)好友劉威、劉歡等到場助陣

      大風(fēng)新聞
      2026-05-09 17:42:09
      安徽一女老師點(diǎn)外賣,發(fā)現(xiàn)騎手是曾經(jīng)的學(xué)生:兼職賺錢,肯努力的人,永遠(yuǎn)都在發(fā)光

      安徽一女老師點(diǎn)外賣,發(fā)現(xiàn)騎手是曾經(jīng)的學(xué)生:兼職賺錢,肯努力的人,永遠(yuǎn)都在發(fā)光

      瀟湘晨報(bào)
      2026-05-09 15:49:26
      泰康銷冠任曉敏被立案:光環(huán)之下,誰在透支信任?

      泰康銷冠任曉敏被立案:光環(huán)之下,誰在透支信任?

      新民周刊
      2026-05-08 19:46:57
      尷尬!王石公開脫衣秀身材“翻車”,網(wǎng)友:像是一副被榨干的軀體

      尷尬!王石公開脫衣秀身材“翻車”,網(wǎng)友:像是一副被榨干的軀體

      火山詩話
      2026-05-08 21:39:02
      產(chǎn)品為基,技術(shù)為擎,用戶為本:紅旗高質(zhì)量發(fā)展三重奏

      產(chǎn)品為基,技術(shù)為擎,用戶為本:紅旗高質(zhì)量發(fā)展三重奏

      大眾侃車
      2026-05-09 17:54:52
      員工人均獎(jiǎng)金達(dá)610萬人民幣?SK海力士回應(yīng)

      員工人均獎(jiǎng)金達(dá)610萬人民幣?SK海力士回應(yīng)

      第一財(cái)經(jīng)資訊
      2026-05-09 16:50:23
      4天內(nèi)3名夜班工作人員突發(fā)心梗、腦梗,年齡均在70歲前后,大連一物業(yè):目前3人都在養(yǎng)病,將改進(jìn)值班排班方式

      4天內(nèi)3名夜班工作人員突發(fā)心梗、腦梗,年齡均在70歲前后,大連一物業(yè):目前3人都在養(yǎng)病,將改進(jìn)值班排班方式

      都市快報(bào)橙柿互動(dòng)
      2026-05-09 22:12:28
      深圳6歲男童吃生菜包烤肉后,全身出現(xiàn)大片青斑、血腫

      深圳6歲男童吃生菜包烤肉后,全身出現(xiàn)大片青斑、血腫

      聽心堂
      2026-05-09 18:11:29
      尷尬!網(wǎng)紅神褲成審美災(zāi)難,網(wǎng)友稱市場有需求,有些人恨不得裸奔

      尷尬!網(wǎng)紅神褲成審美災(zāi)難,網(wǎng)友稱市場有需求,有些人恨不得裸奔

      火山詩話
      2026-05-09 19:50:52
      2026-05-10 02:44:49
      InfoQ incentive-icons
      InfoQ
      有內(nèi)容的技術(shù)社區(qū)媒體
      12350文章數(shù) 51880關(guān)注度
      往期回顧 全部

      科技要聞

      美國政府強(qiáng)力下場 蘋果英特爾達(dá)成代工協(xié)議

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現(xiàn)身

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現(xiàn)身

      體育要聞

      成立128年后,這支升班馬首奪頂級聯(lián)賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認(rèn)不出!

      財(cái)經(jīng)要聞

      多地號召,公職人員帶頭繳納物業(yè)費(fèi)

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態(tài)度原創(chuàng)

      旅游
      親子
      房產(chǎn)
      健康
      教育

      旅游要聞

      不用長途奔波!北京城區(qū)隨處是治愈人心的初夏花海

      親子要聞

      媽媽說女兒休學(xué)一年,我教她3個(gè)笨辦法

      房產(chǎn)要聞

      低價(jià)甩賣!海口這個(gè)地標(biāo)商業(yè),無人接盤!

      干細(xì)胞能讓人“返老還童”嗎

      教育要聞

      天津女教師懟家長!完整錄音曝光,老師很囂張,飯碗恐不保了

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 在线中文字幕国产精品| 暖暖在线视频成人日本二区| 热久久视久久精品2019| 久久99爱国产精品| 国产麻豆9l精品三级站| 亚洲av精彩一区二区| 亚洲精品宾馆在线精品酒店| 五月婷婷久久草| 桂东县| 亚洲第一视频免费在线| 亚洲av无码精品色午夜蛋壳| 777米奇色狠狠俺去啦| 中文字幕人妻无码一区二区三区 | 欧美成妇人吹潮在线播放| 国产精品一区二区 尿失禁| 日本道不卡一二三区视频| 内射一区二区三区四区| 国产裸体AV久无码无遮挡| 波多野结衣一卡二卡| 四川丰满少妇无套内谢| 亚洲欧美日韩国产vr在线观| 国产国拍精品av在线观看| 国产地址二永久伊甸园| 国产精品A片| 久久影院综合精品| 襄垣县| 亚洲啪啪AⅤ一区二区三区| 桃花综合久久久久久久久久网| 极品少妇被后入内射视| 欧美成人h精品网站| 午夜在线精品偷拍| 国产无遮挡又黄又爽免费网站| 夜夜爽夜夜叫夜夜高潮| 国产精品亚洲а∨天堂2021| 在线免费观看污| 久热这里只有精品视频3| 秋霞人妻无码中文字幕| 深夜福利网站| 激情综合网激情综合| 亚洲精品成人a在线观看| 中文字幕亚洲国产精品|