聞樂(lè) 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI
新晉員工確實(shí)毫無(wú)保留。
Jason Liu,13k星開源庫(kù)Instructor的作者,剛被OpenAI招進(jìn)Codex團(tuán)隊(duì)沒(méi)多久,不僅在社交平臺(tái)大方發(fā)API額度;
![]()
還寫了篇Codex-maxxing,把自己的Codex玩法全抖出來(lái)了。
![]()
而且是讓Codex自動(dòng)跟進(jìn)亞馬遜退款、定時(shí)掃Slack接需求、開著Heartbeats在你洗澡的時(shí)候幫你干活的那種。
Codex周活用戶4月底已經(jīng)破了400萬(wàn),終于來(lái)了份“官方使用指南”。
![]()
正好,這兩天Codex又更新了一波:Appshots截圖直喂、Goal模式正式轉(zhuǎn)正、鎖屏后也能遠(yuǎn)程干活
![]()
跟Jason的使用心法疊在一起看會(huì)發(fā)現(xiàn),現(xiàn)在大家比拼的,是誰(shuí)能持續(xù)工作更久,誰(shuí)能真正上崗了……
讓它自己跑起來(lái)
Jason整套玩法的核心,是把Codex改造成了一個(gè)能長(zhǎng)期運(yùn)行、持續(xù)接管任務(wù)的工作系統(tǒng)。
多數(shù)人習(xí)慣單次問(wèn)答結(jié)束就關(guān)閉會(huì)話,但Jason是開著一堆跨月存活的巨型線程,不會(huì)隨意終止。
他給每個(gè)工作流一個(gè)置頂線程:管日程的一個(gè)、管開源項(xiàng)目的一個(gè)、監(jiān)控社交平臺(tái)的一個(gè)……通過(guò)Command-1到Command-9一鍵跳轉(zhuǎn)。
![]()
線程里積累了幾個(gè)月的對(duì)話歷史、偏好和決策,再次使用時(shí)不用重新交代背景,Agent就能自動(dòng)承接進(jìn)度。
當(dāng)線程生命周期被拉長(zhǎng)后,項(xiàng)目背景、溝通習(xí)慣和歷史決策都會(huì)自然沉淀進(jìn)去,Agent開始具備連續(xù)性。
而且Jason下任務(wù)不打字,主要靠說(shuō)。
在他看來(lái),口述能完整保留原始思路,不需要刻意優(yōu)化Prompt,可以直接把模糊、跳躍、帶溯源需求的想法原樣丟給Agent。
再配合Codex的Steering功能,還能在Agent執(zhí)行任務(wù)時(shí)插隊(duì)追加指令,說(shuō)完就走,不用干等。
不過(guò),真正讓Codex從工具變員工的,是Heartbeats+@computer這套組合拳。
![]()
Heartbeats本質(zhì)上相當(dāng)于給Agent加了一層定時(shí)任務(wù)調(diào)度。
Jason有個(gè)Chief of Staff線程,每30分鐘跑一次——
掃一遍Slack和Gmail,看看有沒(méi)有需要回復(fù)的消息,判斷優(yōu)先級(jí),需要回復(fù)的先起草一份草稿,但不發(fā)送,最終由人來(lái)決定是否發(fā)出。
他還舉了一個(gè)更復(fù)雜的例子是,做動(dòng)畫項(xiàng)目時(shí),他會(huì)先把視頻發(fā)到Slack審閱線程,然后讓Codex每15分鐘檢查一次線程。
如果同事提了反饋,Codex就重新渲染一個(gè)新版本并回復(fù)到線程里。
因?yàn)镾lack MCP服務(wù)器還不支持文件上傳,Agent甚至?xí)约赫{(diào)用@computer去點(diǎn)“Add file”按鈕,把渲染好的文件傳上去。
還有一次,Jason在洗澡前讓Codex盯著亞馬遜客服排隊(duì)狀態(tài),結(jié)果等他洗完澡出來(lái),退款已經(jīng)到賬了。
類似的流程,現(xiàn)在已經(jīng)能擴(kuò)展到Google Docs評(píng)論、GitHub PR Review等場(chǎng)景,只要有反饋就自動(dòng)推進(jìn)下一步。
![]()
Jason最強(qiáng)調(diào)的一點(diǎn),是驗(yàn)證機(jī)制,可以判斷任務(wù)什么時(shí)候終止。
他試過(guò)讓Codex把Python的Rich庫(kù)完整遷移到Rust,硬性要求是必須通過(guò)原Python庫(kù)的所有單元測(cè)試。
測(cè)試能不能通過(guò),決定了任務(wù)是否完成;失敗了,Agent就繼續(xù)修。
用他的話說(shuō):
- 沒(méi)有驗(yàn)證機(jī)制的野心,頂多算個(gè)愿望而已。
![]()
而在最新的這次更新中,OpenAI已經(jīng)把Goal模式從實(shí)驗(yàn)版本轉(zhuǎn)正了
你只要明確一個(gè)最終目標(biāo)和驗(yàn)收標(biāo)準(zhǔn),Codex會(huì)自主持續(xù)推進(jìn),短則幾小時(shí)長(zhǎng)則數(shù)天,中途可以查進(jìn)度、調(diào)方向,也可以直接暫停。
但前提是任務(wù)本身必須存在清晰、可驗(yàn)證的反饋閉環(huán)。
記憶放在自己手里
Jason這套用法的另一大核心思路,是個(gè)人工作記憶不應(yīng)該托管在平臺(tái)內(nèi)部
他所有的長(zhǎng)期線程都從一個(gè)Obsidian vault起步,目錄劃分為TODO、people、projects、agent、notes等板塊。
![]()
在頂層AGENTS.md里寫明規(guī)則:人員信息更新、項(xiàng)目推進(jìn)、待辦辦結(jié)等變動(dòng),都要同步更新知識(shí)庫(kù)對(duì)應(yīng)內(nèi)容。
也就是說(shuō),他幾乎放棄了Codex的內(nèi)置記憶系統(tǒng),把核心記憶數(shù)據(jù)存放在本地可控文件中,既能隨時(shí)查閱手動(dòng)修改,也能通過(guò)版本對(duì)比查看變動(dòng),出現(xiàn)問(wèn)題還能一鍵roll back。
原因是AI承載的記憶體量越大,就越不該把數(shù)據(jù)鎖死在單一平臺(tái)。
而文件是完全屬于用戶自己的,后續(xù)想換工具、遷平臺(tái),拎著知識(shí)庫(kù)就能走,毫無(wú)顧慮。
他也提到了Codex自帶的記憶功能Chronicle,通過(guò)截取屏幕內(nèi)容來(lái)構(gòu)建上下文。
但這是需要手動(dòng)開啟的實(shí)驗(yàn)預(yù)覽功能,在權(quán)限、速率和隱私方面存仍在短板,整體方向可行但還不夠成熟。
所以,在他看來(lái),文件系統(tǒng)仍然是最可靠的記憶基礎(chǔ)設(shè)施。
而且Codex工作臺(tái)本身也在升級(jí)。
Codex的側(cè)邊欄不再局限聊天交互,可直接渲染Markdown、篩選表格、閱覽PDF與PPT。
![]()
Agent還能通過(guò)內(nèi)置瀏覽器用JavaScript控制網(wǎng)頁(yè),用戶可以邊看邊標(biāo)注,不用來(lái)回切窗口。
Jason說(shuō)他經(jīng)常在側(cè)邊面板里同時(shí)打開Storybook審閱UI組件、用Remotion Studio做動(dòng)畫、用Slidev做演示文稿。
而他最喜歡的交付形式,就是一個(gè)帶JS和CSS的單文件index.html,不用部署,不用服務(wù)器,打開就能跑。
另外,他還把Connectors和Skills作為可復(fù)用工作流模版。
只要成功做完一件有用的事,就把流程打包起來(lái),下次Codex不用重新學(xué),直接調(diào)用就行。
最近Codex還補(bǔ)了一手遠(yuǎn)程能力,電腦鎖屏后Codex可以繼續(xù)工作,手機(jī)端也能實(shí)時(shí)查看、審批甚至接管任務(wù)。
現(xiàn)在好了,你下班它加班,你鎖屏它干活,超額KPI這不就來(lái)了……
不過(guò),當(dāng)AI可以持續(xù)接管工作,人自己倒是越來(lái)越輕松了(doge)。
參考鏈接:https://x.com/jxnlco/status/2057153744630890620
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.