網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

澳洲放羊大叔引爆AI編程革命！Claude Code急推goal模式，不干完不許停

2026-05-13 18:31:06　來(lái)源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：好困 KingZH

【新智元導(dǎo)讀】澳洲牧羊大叔隨手寫(xiě)的三行bash，11天內(nèi)被OpenAI、Anthropic和Hermes集體收編了。

一覺(jué)醒來(lái)，Claude Code又更新！

為了讓Claude 持續(xù)工作直到任務(wù)完成，Claude Code最近推出的新功能：/goal 。

你只要設(shè)定條件，Claude不完成任務(wù)它絕不罷休！

用過(guò)AI編程工具的人都懂，這到底多重要！

你給Agent下了一個(gè)任務(wù)，它跑了三個(gè)回合，改了兩個(gè)文件，突然停下來(lái)問(wèn)你「接下來(lái)需要我做什么？」

不是，bug你這還沒(méi)修完呢啊！

Agent越來(lái)越聰明，寫(xiě)代碼越來(lái)越快，但「從頭到尾把一件事干完」這件事，到2026年初都沒(méi)有一家能做到。

然后，一位來(lái)自澳大利亞的牧羊大叔Geoffrey Huntley，用三行bash解決了。

done

他把它命名為Ralph Loop，致敬《辛普森一家》里那個(gè)永遠(yuǎn)搞不清狀況但從不放棄的小孩Ralph Wiggum。

邏輯極其粗暴，無(wú)限循環(huán)，反復(fù)把同一個(gè)prompt喂給Agent。進(jìn)度寫(xiě)在文件系統(tǒng)和Git歷史里，上下文滿了就開(kāi)新實(shí)例，讀文件接著干。

原始，不優(yōu)雅，但十分有效。

有效到OpenAI看見(jiàn)了，Nous Research看見(jiàn)了，Anthropic也看見(jiàn)了。

11天，三家頂級(jí)AI實(shí)驗(yàn)室，不約而同地把這三行bash寫(xiě)進(jìn)了官方產(chǎn)品。

這一刻，所有人都明白了一件事——

通用人工智能的臨門(mén)一腳，可能不是更聰明的模型，而是「把事做完」的模型。

換句話說(shuō)，AI編程的核心戰(zhàn)場(chǎng)正在從「生成代碼」轉(zhuǎn)向「閉環(huán)交付」。

11天，三條線，同一個(gè)終點(diǎn)

4月30日，OpenAI的Codex率先上線/goal。

Greg Brockman在X上只丟了一句，「Codex現(xiàn)已內(nèi)置Ralph loop++」。

一周后，Hermes Agent跟上。又過(guò)4天，Claude Code也上了。

11天。三家。同一個(gè)命令。同一個(gè)功能。

但實(shí)現(xiàn)路徑，差了十萬(wàn)八千里。

Codex「不忘事」，Hermes「不爛尾」，Claude Code「不自欺」。

Codex：

把目標(biāo)存成一條數(shù)據(jù)庫(kù)記錄

OpenAI是三家里最先出手的，方案也最簡(jiǎn)潔。

在Codex里，/goal是一個(gè)持久化的工作流對(duì)象，存在本地的app-server狀態(tài)層里。

關(guān)掉終端、合上筆記本、甚至重啟系統(tǒng)，目標(biāo)都不會(huì)丟。下次打開(kāi)Codex，自動(dòng)接上。

模型通過(guò)結(jié)構(gòu)化的update_goal工具匯報(bào)進(jìn)度狀態(tài)，token預(yù)算耗盡時(shí)觸發(fā)「軟著陸」而非硬停。

有人用這個(gè)功能連續(xù)跑了14個(gè)小時(shí)，中間暫停5小時(shí)去睡覺(jué)，回來(lái)Codex從斷點(diǎn)續(xù)跑，把一個(gè)設(shè)備驅(qū)動(dòng)項(xiàng)目做完了。

工程化，干凈，但克制。

Hermes Agent：

一個(gè)人干不完，那就上一個(gè)團(tuán)隊(duì)

Hermes Agent的野心最大。

在這里，/goal只是冰山一角。真正的重頭戲是多智能體看板系統(tǒng)，Hermes把「讓AI把活干完」從單Agent問(wèn)題升級(jí)成了團(tuán)隊(duì)協(xié)作問(wèn)題。

看板的底層是本地SQLite，持久化存儲(chǔ)，跨重啟不丟。

你在上面創(chuàng)建一個(gè)任務(wù)卡片，Hermes會(huì)直接把它拆成多個(gè)子任務(wù)，分配給不同的Agent worker。每個(gè)worker是一個(gè)獨(dú)立的OS進(jìn)程，有自己的身份、模型配置和工作目錄。

看板和/goal是兩套互補(bǔ)的系統(tǒng)。/goal管的是單個(gè)Agent的目標(biāo)鎖定（Ralph loop），看板管的是多個(gè)Agent之間的任務(wù)調(diào)度。一個(gè)縱向深入，一個(gè)橫向鋪開(kāi)。

最后，是五層防爛尾機(jī)制。

第一層，心跳檢測(cè)。每個(gè)worker定期向看板報(bào)到，證明自己還活著。

第二層，僵尸回收。worker超時(shí)沒(méi)響應(yīng)？系統(tǒng)自動(dòng)判定死亡，回收它手上的任務(wù)重新分配。macOS上還有專門(mén)的達(dá)爾文僵尸檢測(cè)邏輯。

第三層，退出攔截。worker沒(méi)完成任務(wù)就退出了？系統(tǒng)自動(dòng)把它標(biāo)記為blocked，不讓它再接新活，防止「摸魚(yú)型Agent」反復(fù)領(lǐng)任務(wù)又不做。

第四層，幻覺(jué)攔截。這是最狠的一層。AI說(shuō)「我做完了」不算數(shù)，系統(tǒng)會(huì)驗(yàn)證它實(shí)際產(chǎn)出的代碼是否真的落盤(pán)了。Agent說(shuō)自己創(chuàng)建了一個(gè)文件但實(shí)際上沒(méi)有？抓住，回滾，重來(lái)。

第五層，重試預(yù)算。每個(gè)任務(wù)有獨(dú)立的max_retries，最多重試N次，超過(guò)就上報(bào)人類。絕對(duì)不會(huì)無(wú)限循環(huán)到死機(jī)。

Claude Code：

做事的人和驗(yàn)收的人，不能是同一個(gè)

Anthropic是三家里最后出手的，但方案最巧妙。

本質(zhì)上，Claude Code的/goal是一個(gè)session級(jí)別的Stop Hook。

你設(shè)定一個(gè)完成條件（比如「test/auth目錄下所有測(cè)試通過(guò)且lint無(wú)報(bào)錯(cuò)」），Claude就開(kāi)始干活。

關(guān)鍵設(shè)計(jì)在驗(yàn)收環(huán)節(jié)。每干完一輪，系統(tǒng)不讓Claude自己判斷「我做完了沒(méi)有」。

它把對(duì)話記錄和你的完成條件一起發(fā)給一個(gè)獨(dú)立的小模型（默認(rèn)是Haiku），讓這個(gè)小模型來(lái)裁判。

小模型如果覺(jué)得沒(méi)完成，就需要返回一個(gè)具體理由（比如「test_login.py還有2個(gè)failure」）。然后這個(gè)理由會(huì)被注入Claude下一輪的上下文，指導(dǎo)它接著干。

如果小模型認(rèn)為完成了，目標(biāo)就會(huì)自動(dòng)清除，任務(wù)結(jié)束。

值得一提的是，這個(gè)裁判模型不調(diào)用任何工具，不讀文件，不跑命令。它只看Claude在對(duì)話里產(chǎn)出的內(nèi)容。

所以，你的完成條件必須是Claude在對(duì)話中能證明的東西。

它最長(zhǎng)支持4000字符，因此你可以寫(xiě)得很細(xì)。

甚至，還可以在條件里加約束，比如「不修改其他測(cè)試文件」「20輪內(nèi)完成否則停止」等等。

決賽進(jìn)行時(shí)：工作流入口

把視角拉遠(yuǎn)一步。

Claude Code背后站著Anthropic，Codex背后站著OpenAI，Hermes Agent接入了兩邊的模型，同時(shí)也是DeepSeek V4等模型的主力分發(fā)渠道。

三條路徑，恰好覆蓋了ASI決賽的三個(gè)生態(tài)入口。

而他們爭(zhēng)的，也是同一樣?xùn)|西——工作流。

誰(shuí)的Agent先讓開(kāi)發(fā)者養(yǎng)成「設(shè)完目標(biāo)就走開(kāi)」的習(xí)慣，誰(shuí)就鎖死了工作流入口。

因?yàn)榱?xí)慣一旦形成，遷移成本是指數(shù)級(jí)的。

你不會(huì)輕易離開(kāi)一個(gè)已經(jīng)跑通了看板調(diào)度、斷點(diǎn)續(xù)傳、checkpoint回滾的Agent基礎(chǔ)設(shè)施。

一個(gè)看似很小的/goal命令，背后卡的是整條Agent工作流的護(hù)城河。

參考資料：

https://code.claude.com/docs/en/goal

https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7

https://github.com/anthropics/claude-code/releases/tag/v2.1.139

https://developers.openai.com/codex/changelog

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.