![]()
出品丨AI 科技大本營(yíng)(ID:rgznai100)
如果你錯(cuò)過(guò)了幾天前 Anthropic 最新舉辦的 “Code w/ Claude” 開(kāi)發(fā)者大會(huì),那你可能正在錯(cuò)過(guò)軟件工程史上最大的一次范式轉(zhuǎn)移。
整場(chǎng)大會(huì)的核心信息只有一個(gè):AI 模型的能力正在呈“指數(shù)級(jí)”增長(zhǎng),但大多數(shù)企業(yè)的開(kāi)發(fā)模式仍停留在“線性”階段。為了幫開(kāi)發(fā)者抹平這道鴻溝,Anthropic 祭出了三大殺手锏:更強(qiáng)的底層模型、全新的Claude Platform代理編排能力,以及徹底顛覆日常開(kāi)發(fā)的Claude Code桌面端。
![]()
在這場(chǎng) Keynote 里,Anthropic 請(qǐng)出的幾乎都是自家產(chǎn)品和工程團(tuán)隊(duì)的一號(hào)位:首席產(chǎn)品官 Ami Vora 先把背景講透,研究產(chǎn)品負(fù)責(zé)人 Dianne Penn 解釋模型層為什么還會(huì)繼續(xù)爆發(fā),Claude Platform 團(tuán)隊(duì)用一場(chǎng)科幻感拉滿(mǎn)的月球無(wú)人機(jī)演示,把multi-agent、outcomes 和 dreaming這些新能力一次攤開(kāi);到了 Claude Code 環(huán)節(jié),Cat Wu 和 Claude 負(fù)責(zé)人 Boris Cherny 則把另一條線徹底講明白——同步編程正在退到后臺(tái),能持續(xù)跑任務(wù)、自動(dòng)修 PR、自動(dòng)處理 CI 報(bào)錯(cuò)的異步開(kāi)發(fā)流,開(kāi)始成為新的默認(rèn)選項(xiàng)。
下面我們就按這條主線往下看:Anthropic 到底想怎么定義下一代開(kāi)發(fā)流,Claude 平臺(tái)和 Claude Code 分別把哪一部分往前推了一大步。
Ami Vora:大家早上好!很高興見(jiàn)到各位,感謝大家的到來(lái)。
回想我今天為什么站在這里,思緒不禁回到了我第一次成功運(yùn)行代碼的那一刻。我并非從小就接觸編程,我在阿巴拉契亞山脈的山腳下長(zhǎng)大,沒(méi)自己組裝過(guò)電腦,甚至不怎么玩電子游戲。我第一次嘗試構(gòu)建復(fù)雜的項(xiàng)目,是在大學(xué)的計(jì)算機(jī)科學(xué)課上。那已經(jīng)是很久以前的事了,當(dāng)時(shí)我們還得排隊(duì)登錄服務(wù)器,因?yàn)橹挥兴懔驈?qiáng),跑得動(dòng)我們的光線追蹤程序。
![]()
在座的有些人對(duì)那番場(chǎng)景肯定不陌生:服務(wù)器的嗡嗡聲、隔夜披薩和咖啡的混合氣味,還有無(wú)窗地下室機(jī)房特有的味道。但我依然記得按下“編譯”鍵后等待結(jié)果的那種心情——當(dāng)發(fā)現(xiàn)程序真的跑通時(shí),那種純粹的喜悅、發(fā)現(xiàn)新大陸的激動(dòng)、如釋重負(fù)的輕松,以及意識(shí)到自己在這個(gè)世界上創(chuàng)造出前所未有之物的震撼。正是那種感覺(jué)讓我徹底著迷,也是我今天站在這里的原因。
時(shí)代變了。當(dāng)年我只能在大學(xué)機(jī)房排隊(duì)求取的東西,如今世上的任何人、在任何地點(diǎn)、任何時(shí)候都能唾手可得。無(wú)需排隊(duì),沒(méi)有怪味,也沒(méi)有門(mén)檻,但那種激動(dòng)、喜悅與如釋重負(fù)的感覺(jué)卻原封未動(dòng)。我知道在座的很多人深有同感。常有人對(duì)我說(shuō):“Claude 讓我感覺(jué)自己擁有了超能力。” 這是我最?lèi)?ài)聽(tīng)的評(píng)價(jià)。
我們正在目睹大家如何施展這種超能力。比如,Stripe 的開(kāi)發(fā)基礎(chǔ)設(shè)施負(fù)責(zé)人 Scott MacVicar,他的團(tuán)隊(duì)有5 萬(wàn)行 Scala 代碼必須轉(zhuǎn)寫(xiě)成 Java,才能升級(jí) JDK。他們最初估算這需要耗費(fèi)工程師整整 10 周的時(shí)間。結(jié)果他們用了 Claude,只花了4 天就全部搞定。
有時(shí),速度的意義不僅僅在于效率,更在于它能觸達(dá)的彼岸。Felicia Curcuru 是 Binti 的聯(lián)合創(chuàng)始人兼 CEO,她的軟件系統(tǒng)專(zhuān)門(mén)協(xié)助社工為寄養(yǎng)兒童尋找家庭。處理文件、上門(mén)走訪、資質(zhì)審核……今年,她的團(tuán)隊(duì)利用 Claude API,把社工從繁瑣的文書(shū)中解放出來(lái),讓整個(gè)寄養(yǎng)家庭的資質(zhì)審批流程足足縮短了 20 天。20 天——這絕不僅僅是一個(gè)冷冰冰的效率指標(biāo),這意味著一個(gè)孩子能提前 20 天擁有一個(gè)家。
這種激動(dòng)、喜悅、輕松和發(fā)現(xiàn)新事物的震撼,是我從大家身上聽(tīng)到的共鳴。但我猜,在座各位體驗(yàn)它的方式各不相同。你們當(dāng)中,有人每天都在技術(shù)的最前沿沖浪;有人在努力帶動(dòng)身邊的人一起進(jìn)化;還有人來(lái)到這里,是因?yàn)楹臀乙粯樱杏X(jué)到了腳下技術(shù)板塊的劇烈運(yùn)動(dòng),想看清未來(lái)的圖景。相信我,我經(jīng)常在一個(gè)早上就能體會(huì)到上述所有的情緒。我常常帶著計(jì)劃來(lái)上班,到了午休時(shí)就把計(jì)劃撕得粉碎,因?yàn)橛钟行峦黄瓢l(fā)生了。這感覺(jué)耳熟嗎?
當(dāng)我們退后一步,看看這些模型進(jìn)化的速度有多快時(shí),這一切就說(shuō)得通了。在 Anthropic,我們常把“指數(shù)級(jí)躍升”掛在嘴邊。我想這正是我們當(dāng)下的集體感受。大家還記得嗎??jī)H僅兩年前,模型領(lǐng)域的終極目標(biāo),還是寫(xiě)出一封像樣的電子郵件,我們就已經(jīng)謝天謝地了。一年前,我們站在這個(gè)舞臺(tái)上,頭條是 Opus 4,當(dāng)時(shí)“讓一個(gè)智能體(Agent)在無(wú)需人類(lèi)干預(yù)的情況下連續(xù)運(yùn)行一小時(shí)”還像是一個(gè)登月計(jì)劃。
然而六個(gè)月前,智能體已經(jīng)可以整晚跑端到端的任務(wù),我們每天醒來(lái)就能驗(yàn)收成果。就在上個(gè)月,Mythos 通讀了 OpenBSD 的整個(gè)源代碼樹(shù),揪出了一個(gè)潛伏了 27 年、躲過(guò)了人類(lèi)審查、模糊測(cè)試和靜態(tài)分析長(zhǎng)達(dá)近三十年的漏洞。技術(shù)飛躍的幅度越來(lái)越大,而間隔的時(shí)間卻越來(lái)越短。
盡管模型的能力正呈指數(shù)級(jí)爆發(fā),但大多數(shù)組織應(yīng)用 AI 的方式卻依然按部就班。這就導(dǎo)致“AI 能做什么”和“AI 真正在幫人類(lèi)解決什么”之間,出現(xiàn)了一道鴻溝。彌合這道鴻溝,將模型的能力轉(zhuǎn)化為普通人解決問(wèn)題的利器——正是開(kāi)發(fā)者的使命。這正是你們正在做的事,而且成效斐然。在 Claude 平臺(tái)上,API 的調(diào)用量同比激增了近17 倍;在 Claude Code 上,開(kāi)發(fā)者平均每周花在運(yùn)行 Claude 上的時(shí)間已達(dá)20 小時(shí)。
和你們一樣,我們最近也處于瘋狂交付的狀態(tài)。我們希望大家今天離開(kāi)時(shí),腦海中能有一幅清晰的未來(lái)圖景,這樣你們就能未雨綢繆,與我們一起乘上指數(shù)級(jí)爆發(fā)的東風(fēng)。我要先聲明,今天我們沒(méi)有新模型要發(fā)布。今天的主題是——我們?nèi)绾巫尞a(chǎn)品更好地為您服務(wù),以便您能為整個(gè)世界彌合這道鴻溝。今天上午,我們將為大家展示它的全貌。
首先,Dianne 將談?wù)勎覀兊幕P蛯印K龑⒎窒砀嚓P(guān)于我們前沿模型的進(jìn)展和未來(lái)規(guī)劃。在 Claude 平臺(tái)上,我們將對(duì) Claude 托管智能體(Managed Agents)進(jìn)行重大更新,包括:目標(biāo)導(dǎo)向(Outcomes)、模型造夢(mèng)(Dreaming)以及多智能體協(xié)同(Multi-agent orchestration)。Angela 和 Katelyn 將為大家演示平臺(tái)是如何幫您包攬底層基礎(chǔ)設(shè)施,讓您免受繁文縟節(jié)之苦的。在 Claude Code 方面,Cat 和 Boris 將指導(dǎo)您如何使用諸如 Routines 等新原語(yǔ)(primitives),讓 Claude Code 能夠自我提示(prompt itself),哪怕您不在電腦前它也能繼續(xù)干活。
但這一切,最終都要回歸到你們,以及你們即將創(chuàng)造的產(chǎn)品上。因?yàn)榻^大多數(shù)人一輩子都不會(huì)去調(diào)用 Claude API,更不會(huì)打開(kāi)終端輸入“Claude”。他們只會(huì)通過(guò)你們?cè)?Claude 平臺(tái)上構(gòu)建的產(chǎn)品來(lái)體驗(yàn) AI。無(wú)論那是一位用 Canva 探索新靈感的設(shè)計(jì)師,一位用 Legora 飛速搞定法律文書(shū)的律師,還是任何一位使用世界頂尖編程智能體的開(kāi)發(fā)者。感謝你們,是你們塑造了 AI 在世人眼中的模樣。我們永遠(yuǎn)無(wú)法單槍匹馬地構(gòu)建出解決所有人問(wèn)題的所有工具,這只能依靠你們。
為了表達(dá)我們的感激之情,我們帶來(lái)了一個(gè)好消息。從今天起,我們將提高 Claude Code 和 Claude 平臺(tái)開(kāi)發(fā)者的速率限制(Rate limits),助你們一臂之力,繼續(xù)為世界彌合鴻溝。具體來(lái)說(shuō),我們不僅為 Pro、Max、Team 和基于席位的 Enterprise 計(jì)劃翻倍了 Claude Code 的 5 小時(shí)速率限制,還大幅提升了 Claude Opus 的 API 限制。
之所以能做到這一點(diǎn),是因?yàn)槲覀償U(kuò)大了算力合作版圖——我們正在與SpaceX合作,滿(mǎn)載調(diào)用他們 Colossus 1 數(shù)據(jù)中心的全部算力。我們將把這些資源直接投資給獨(dú)立開(kāi)發(fā)者和小型團(tuán)隊(duì)。隨著時(shí)間推移,我們將繼續(xù)探索各種途徑幫您發(fā)揮 Claude 的最大潛能,無(wú)論是現(xiàn)有的算力合作,還是未來(lái)更激進(jìn)的押注。
感謝各位今天的到來(lái)。感謝你們與我們攜手,共同定義 AI 在現(xiàn)實(shí)世界中的模樣。感謝你們,把超能力交到了大眾手中。接下來(lái),有請(qǐng)我們研究產(chǎn)品團(tuán)隊(duì)的負(fù)責(zé)人 Dianne。謝謝!
Dianne Penn:謝謝 Ami。我是 Dianne,2023 年加入 Anthropic。從 Claude 2 開(kāi)始,我見(jiàn)證了每一個(gè)模型的誕生。如果有人在數(shù)的話(huà),我們已經(jīng)把橫跨 Haiku、Sonnet、Opus 和現(xiàn)在的 Mythos 的 18 個(gè) Claude 版本,帶給了像你們一樣的用戶(hù)和開(kāi)發(fā)者。
我們?cè)g盡腦汁,既想讓 Opus 3 完美遵循 JSON 格式,又要讓它成為編寫(xiě)長(zhǎng)篇代碼的王者。在 Sonnet 3.5 New(也就是大家現(xiàn)在終于習(xí)慣叫的 Sonnet 3.6)上,我們教會(huì)了 Claude 如何安全地操作計(jì)算機(jī)。到了 Sonnet 3.7,它有時(shí)候表現(xiàn)得稍微有些“急功近利”,于是我們找到了合適的方式將其開(kāi)放給用戶(hù)和開(kāi)發(fā)者,讓你們能摸透它的脾氣。去年的這個(gè)時(shí)候,我們利用 Claude 4 在思維推演(thinking dials)和測(cè)試時(shí)算力(test-time compute)的調(diào)節(jié)上找到了完美平衡。我們從未放慢腳步。在過(guò)去的 12 個(gè)月里,我們向開(kāi)發(fā)者和用戶(hù)交付了 8 款前沿模型。每一代都在前一代的肩膀上躍升,讓你們能寫(xiě)出更優(yōu)雅的代碼,讓你們構(gòu)建的產(chǎn)品走得比以往任何時(shí)候都遠(yuǎn)。
![]()
模型層是今天大家將聽(tīng)到的所有創(chuàng)新的底座。這是最核心的共識(shí)。隨著模型智商的躍升,你們的起跑線也隨之前移,你們能做到的事情將突破想象。在 Anthropic,我們常提“指數(shù)級(jí)躍升”,Ami 剛才也提到了。對(duì)我而言,它的意義在于:當(dāng)模型變聰明時(shí),你們能為用戶(hù)打造的應(yīng)用場(chǎng)景也會(huì)呈指數(shù)級(jí)爆發(fā)。比如,擁有自主規(guī)劃能力的“智能體編程”,其顛覆性遠(yuǎn)遠(yuǎn)大于簡(jiǎn)單的“代碼補(bǔ)全”。以此類(lèi)推,新產(chǎn)品和新體驗(yàn)會(huì)開(kāi)辟新市場(chǎng),把整個(gè)蛋糕做大。
在研究團(tuán)隊(duì)眼里,“指數(shù)級(jí)躍升”絕不是單純刷 SWE-bench 的跑分。它關(guān)乎于創(chuàng)造并追蹤那些我們不刻意設(shè)計(jì)就不存在的全新能力:工具調(diào)用、接管計(jì)算機(jī)操作系統(tǒng)、根據(jù)問(wèn)題難度自適應(yīng)的思維深度;能在成百上千個(gè)步驟中不忘初心的智能體循環(huán);以及能讓 Claude 吸收全新知識(shí)的超長(zhǎng)上下文窗口。這些能力絕不局限于寫(xiě)代碼。今天的 Claude 已經(jīng)能生成并迭代視覺(jué)設(shè)計(jì),能分析和創(chuàng)建復(fù)雜的業(yè)務(wù)交付物,還能在充滿(mǎn)不確定性的商業(yè)領(lǐng)域游刃有余。這都是因?yàn)榈讓拥哪P痛竽X變得足夠聰明、足夠強(qiáng)壯,撐起了這一切。
當(dāng)你們基于 Claude 進(jìn)行開(kāi)發(fā)時(shí),你們踩在那條最先創(chuàng)造出這些能力、并花了最長(zhǎng)時(shí)間打磨其穩(wěn)定性的模型產(chǎn)品線上。讓我用最新發(fā)布的 Opus 4.7 給大家舉個(gè)實(shí)際的例子。編碼智能體公司 Amp 把他們所有的“智能模式”都遷移到了 Opus 4.7 上,因?yàn)樗粌H跑分碾壓全場(chǎng),更重要的是,他們發(fā)現(xiàn)可以直接砍掉很多冗余的腳手架和工具——因?yàn)槟P鸵呀?jīng)聰明到不需要這些輔助了。樂(lè)天(Rakuten)在他們的基準(zhǔn)測(cè)試中跑了我們的模型,解決的生產(chǎn)環(huán)境工程任務(wù)數(shù)量達(dá)到了原來(lái)的三倍。Intuit 則發(fā)現(xiàn),Opus 4.7 甚至能在規(guī)劃階段自己揪出自己的邏輯漏洞,自我糾錯(cuò),回溯重演,最終交出一份執(zhí)行速度更快、極其清爽的代碼。
Opus 4.7 發(fā)布的第二天,我們就推出了 Anthropic 實(shí)驗(yàn)室的“Claude Design”,這是我今年最鐘愛(ài)的項(xiàng)目之一。大家已經(jīng)開(kāi)始用 Claude Design 和 Claude Code 的組合拳來(lái)生成生產(chǎn)級(jí)別的 UI 界面了。這是因?yàn)?Opus 4.7 擁有極佳的視覺(jué)審美品味,懂得拿捏分寸,能在遵循你設(shè)計(jì)原則的同時(shí)呈現(xiàn)出絕佳的細(xì)節(jié)。在日常交流中我們也常聽(tīng)到,大家喜歡用 Claude,是因?yàn)樗粌H能聽(tīng)懂你分配的任務(wù),還能察覺(jué)出哪里不對(duì)勁,甚至敢于反問(wèn)、質(zhì)疑你的前提假設(shè)。
當(dāng)然,身為開(kāi)發(fā)者的我們心知肚明,現(xiàn)在的模型還是半成品,還在進(jìn)化中。它們有時(shí)會(huì)被極其低級(jí)的問(wèn)題絆倒,在塞入大量上下文時(shí)也會(huì)“斷片兒”。但正因如此,這一切才令人興奮,感謝你們陪我們一起走這條路。
向大家透露一點(diǎn)我們正在攻克的目標(biāo):首先是更高階的判斷力和更卓越的代碼品味。這意味著未來(lái)的 Claude 能穩(wěn)穩(wěn)接住復(fù)雜的、完全自主的工程項(xiàng)目。其次是讓人感覺(jué)深不見(jiàn)底的上下文窗口,配合高質(zhì)量的記憶庫(kù),讓模型在處理長(zhǎng)時(shí)間軸任務(wù)時(shí)游刃有余,且越做越好。最后是多智能體協(xié)同,驅(qū)動(dòng)由多個(gè) Claude 分身組成的智能團(tuán)隊(duì),協(xié)作完成那些單個(gè)實(shí)例永遠(yuǎn)無(wú)法獨(dú)自消化的宏大目標(biāo)。
我評(píng)估模型智商進(jìn)步的一個(gè)核心維度是“任務(wù)視界(Task horizon)”——即一個(gè)模型能夠脫離人類(lèi)干預(yù)、自主工作并持續(xù)改進(jìn)成果的時(shí)間長(zhǎng)度。去年今日,模型只能自主工作幾分鐘。而現(xiàn)在,在座的很多人和我一樣,手里的智能體經(jīng)常能連續(xù)跑上好幾個(gè)小時(shí)。到了明天,我們將擁有能主動(dòng)出擊、時(shí)刻在線、且絕對(duì)不會(huì)“迷失自我”的智能體。
作為開(kāi)發(fā)者,我們?cè)撊绾慰创@一切?指數(shù)級(jí)躍升不會(huì)停止,所以你們?cè)跇?gòu)建產(chǎn)品時(shí),必須錨定“未來(lái)即將涌現(xiàn)的能力”,而不是局限于當(dāng)下版本的 Claude 能做什么。因?yàn)樾乱淮P蛯⒈饶阄椰F(xiàn)在手里的強(qiáng)大得多。過(guò)去,我們得靠堆砌各種腳手架來(lái)給舊版 Claude“打補(bǔ)丁”;現(xiàn)在,腳手架的作用是去“放大”模型的智慧。過(guò)去,你得精心設(shè)計(jì)復(fù)雜的迭代循環(huán),投喂各種工具,苦苦研究重試機(jī)制;現(xiàn)在,這些都可以?xún)?nèi)化為模型自身的思考與執(zhí)行邏輯。你們已經(jīng)能窺見(jiàn)未來(lái)的模樣了——Opus 的預(yù)覽版Mythos,就是這條指數(shù)曲線上的下一個(gè)爆點(diǎn),而且跨度極其驚人。
因此,我們所有人和模型打交道的方式都需要重塑。
在 Anthropic,我們總結(jié)了以下幾點(diǎn):首先,為下一個(gè)版本的 Claude 做設(shè)計(jì),而不僅僅是現(xiàn)在的。無(wú)數(shù)次的歷史經(jīng)驗(yàn)告訴我們,最終贏家總是那些優(yōu)化了架構(gòu)、隨時(shí)準(zhǔn)備擁抱下一次智力爆發(fā)的開(kāi)發(fā)者,而不是那些死磕當(dāng)下那點(diǎn)微小準(zhǔn)確率的人。這就要求你們?nèi)ソ⒏量痰脑u(píng)估體系,去構(gòu)建那些在今天看來(lái)近乎異想天開(kāi)的原型。因?yàn)橹挥羞@樣,當(dāng)指數(shù)級(jí)曲線悄然躍升時(shí),你們才會(huì)第一時(shí)間察覺(jué)——嘿,那個(gè)昨天還跑不通的東西,今天突然自己跑通了!這往往是個(gè)信號(hào):你挖到了一個(gè)能驚艷用戶(hù)的寶藏。
那些把 Claude 用到極致的團(tuán)隊(duì)都明白一個(gè)道理:模型的升級(jí),就是商機(jī)的爆發(fā)。他們?cè)缇痛罱ê昧俗詣?dòng)化評(píng)估、精簡(jiǎn)的腳手架框架,以及別人尚未察覺(jué)的、充滿(mǎn)野心的原型系統(tǒng),從而讓每次升級(jí)的成本降到最低。
我們堅(jiān)信,隨著模型越來(lái)越聰明,在座的各位開(kāi)發(fā)者將擁有極大的先發(fā)優(yōu)勢(shì),去試水新場(chǎng)景,去創(chuàng)造讓人尖叫的新產(chǎn)品,最終定義新市場(chǎng),把蛋糕做大。接下來(lái) Katelyn 和 Angela 將向你們展示的所有工具,都將讓這一切從夢(mèng)想變?yōu)楝F(xiàn)實(shí)。非常感謝大家!
Angela Jiang:模型的能力正呈指數(shù)級(jí)爆發(fā),但企業(yè)的運(yùn)作卻依然按部就班。對(duì)于企業(yè)來(lái)說(shuō),能不能真正駕馭這條指數(shù)曲線,成為了生死攸關(guān)的考驗(yàn)。究竟是什么攔住了企業(yè)跟上步伐的腳步?說(shuō)到底,就是兩大難題。第一個(gè)難題是:拿到滿(mǎn)意的結(jié)果(Outcomes)還是太難了。你得做大量的提示詞優(yōu)化、工具重構(gòu)、外圍工程的搭建……要讓模型準(zhǔn)確駛?cè)肽阆胍能壍溃廊灰馁M(fèi)無(wú)數(shù)心血。
Katelyn Lesse:沒(méi)錯(cuò)。第二個(gè)難題是:你想跑得快,但又想穩(wěn)穩(wěn)地?cái)U(kuò)大規(guī)模。現(xiàn)在科技圈卷得飛起,你必須跟上節(jié)奏。但要贏,質(zhì)量也得跟上。做個(gè)原型(Prototype)很容易,但在生產(chǎn)環(huán)境里規(guī)模化(Scale)卻難如登天。我們構(gòu)建 Claude 平臺(tái),就是為了給你們提供所需的一切:既能拿到出色的成果,又能兼顧速度與規(guī)模。平臺(tái)上配備了專(zhuān)門(mén)針對(duì) Claude 模型調(diào)優(yōu)的 API 原語(yǔ),為您搭建和擴(kuò)展智能體系統(tǒng)提供了現(xiàn)成的基礎(chǔ)設(shè)施,并賦予您操作這些系統(tǒng)的絕對(duì)控制權(quán)。
Angela Jiang:就是這樣。如果回看我們經(jīng)常從企業(yè)那里聽(tīng)到的痛點(diǎn),我和 Katelyn 最常聽(tīng)到的就是:企業(yè)極度渴求高智商的模型,但同時(shí)必須壓低成本。為了解決這個(gè)問(wèn)題,我們推出了“導(dǎo)師策略(Advisor strategy)”。它的實(shí)現(xiàn)非常簡(jiǎn)單,你只需在 Messages API 中更新你的工具數(shù)組(tools array)即可。我們提供了一種分離“執(zhí)行”與“指導(dǎo)”的智能體架構(gòu):在執(zhí)行層,你可以挑一個(gè)小模型,成本很低;但當(dāng)這個(gè)小模型卡殼、需要建議時(shí),它可以直接去向大模型“請(qǐng)教”。
Katelyn Lesse:在實(shí)際應(yīng)用中,這意味著你可以讓 Haiku 或 Sonnet 級(jí)別的模型去干體力活,讓 Opus 作為導(dǎo)師在背后坐鎮(zhèn)。當(dāng)我們運(yùn)行“Sonnet 執(zhí)行 + Opus 指導(dǎo)”的架構(gòu)時(shí),我們發(fā)現(xiàn) Sonnet 的表現(xiàn)遠(yuǎn)超它單兵作戰(zhàn)的時(shí)候。但更震撼的是,整個(gè)流程算下來(lái)的成本,甚至比單獨(dú)跑 Sonnet 還要便宜,因?yàn)?Opus 的一語(yǔ)道破,讓 Sonnet 少走了很多彎路。Eve Legal 就是一個(gè)絕佳的例子,他們使用了導(dǎo)師策略后告訴我們,他們用只有原來(lái)五分之一的成本,做出了前沿大模型級(jí)別的質(zhì)量。
Angela Jiang:這太棒了。我們特別喜歡這種玩法,因?yàn)槟憧梢园阉昝缿?yīng)用到“免費(fèi)增值(Freemium)”的商業(yè)模式中。在給用戶(hù)提供免費(fèi)體驗(yàn)時(shí),你肯定要控制成本,但同時(shí)又不想降低體驗(yàn)質(zhì)量。在那些并發(fā)量極大、ROI 計(jì)算極其嚴(yán)苛的場(chǎng)景里,這一招簡(jiǎn)直是殺手锏。
好,成本和效果的問(wèn)題解決了,那 Katelyn 剛才提到的“速度與規(guī)模化”這對(duì)死對(duì)頭呢?最近,我們推出了Claude 托管智能體(Claude Managed Agents)。這是一套將智能體運(yùn)行環(huán)境與企業(yè)級(jí)基礎(chǔ)設(shè)施完美綁定的方案。使用它,團(tuán)隊(duì)從原型跑通到上線生產(chǎn)環(huán)境,往往只需要幾天時(shí)間。與我們合作的團(tuán)隊(duì),在托管智能體的加持下,交付速度實(shí)打?qū)嵉靥嵘?10 倍。
托管智能體另一個(gè)讓我們引以為傲的地方,是它出廠自帶了許多行業(yè)最佳實(shí)踐。比如,在構(gòu)建智能體時(shí),最核心的鐵律之一就是給它裝上“記憶(Memory)”。這樣智能體就能記住用戶(hù)的偏好,在每一次交互中越來(lái)越懂你。但從頭手寫(xiě)一個(gè)記憶系統(tǒng)是很痛苦的,所以這成了一個(gè)我們開(kāi)箱即用的功能,而且它與 Claude 是天然適配的。同時(shí)我要向大家保證:當(dāng)智能體生成記憶時(shí),這些數(shù)據(jù)完全歸你所有,你可以隨時(shí)把它打包帶走到任何你想去的地方。
Katelyn Lesse:Notion 就是基于托管智能體構(gòu)建產(chǎn)品的教科書(shū)級(jí)案例。他們既要速度又要規(guī)模,所以果斷選擇了這套方案。他們?cè)诋a(chǎn)品內(nèi)部?jī)?nèi)置了觸發(fā) Claude 智能體的功能,去處理那些耗時(shí)長(zhǎng)、極度復(fù)雜且需要自主運(yùn)行的任務(wù)。
Angela Jiang:那個(gè)功能超酷的。今天,我們要給 Claude 托管智能體注入三項(xiàng)極其硬核的新特性: 我們將引入“多智能體協(xié)同(Multi-agent orchestration)”,讓你能組建智能體艦隊(duì)來(lái)攻克復(fù)雜難關(guān)。 我們將引入“目標(biāo)導(dǎo)向(Outcomes)”,允許你精確定義什么是“成功”,然后 Claude 會(huì)像咬死獵物的獵犬一樣,不斷迭代直到達(dá)成目標(biāo)。 我們還將引入“模型造夢(mèng)(Dreaming)”。這個(gè)功能讓我們非常興奮——通過(guò)“造夢(mèng)”,Claude 獲得了自主學(xué)習(xí)的能力。它能在空閑時(shí)回顧之前的會(huì)話(huà),反思自己漏掉了什么技能、該吸取什么教訓(xùn),然后自動(dòng)把這些經(jīng)驗(yàn)刻進(jìn)自己的記憶庫(kù)里。與其站在這里干講,不如我們直接給大家來(lái)個(gè)現(xiàn)場(chǎng)演示吧。Katelyn,我們開(kāi)始吧。
![]()
Angela Jiang:我和 Katelyn 被今天早些時(shí)候發(fā)布的消息徹底激發(fā)了靈感。Opus 的 API 限制放寬了,我們最近又經(jīng)常和某家太空公司的人混在一起。所以我們倆一拍即合,決定虛構(gòu)一家我們自己的初創(chuàng)公司,叫 Lumara。在 Lumara,我們要做的是開(kāi)發(fā)一款智能體軟件,實(shí)現(xiàn)無(wú)人機(jī)在月球上的自動(dòng)著陸。我們對(duì)速度和規(guī)模有著病態(tài)的追求,所以毫無(wú)疑問(wèn),我們要把它建在 Claude 托管智能體上。
Katelyn Lesse:沒(méi)錯(cuò)。假設(shè)我們拿下了第一個(gè)客戶(hù),這位虛構(gòu)的金主爸爸想把無(wú)人機(jī)降落在月球上,去開(kāi)采虛構(gòu)的礦產(chǎn)。這是一個(gè)龐大且野心勃勃的工程,盡管我們滿(mǎn)懷夢(mèng)想,但我倆都不是航天工程師。所以我們迫切需要一群極其硬核的智能體來(lái)幫我們干活。我們打算把剛才提到的三大新功能全融進(jìn)去。我們已經(jīng)為客戶(hù)打了個(gè)樣,現(xiàn)在我將用 Claude API 的命令行工具(CLI),向大家演示我們是如何配置的。
首先,活兒太重,所以我們要派多名智能體上陣。大家請(qǐng)看我們?yōu)榭蛻?hù)配置的智能體陣容:第一位是“指揮官”,核心職責(zé)是大局統(tǒng)籌,確保任務(wù)順利;第二位是“探測(cè)員”,負(fù)責(zé)尋礦,找出那些富含高純度礦物的著陸點(diǎn);最后是“領(lǐng)航員”,負(fù)責(zé)平穩(wěn)駕駛無(wú)人機(jī),確保安全觸陸。
現(xiàn)在,我把“指揮官”設(shè)置為另外兩位智能體的協(xié)調(diào)員。正如 Angela 所說(shuō),在運(yùn)行過(guò)程中,指揮官會(huì)拉起一個(gè)主會(huì)話(huà),而每個(gè)子智能體都在自己獨(dú)立的線程中運(yùn)行,擁有獨(dú)立的上下文窗口。這是一個(gè)極其精妙的設(shè)計(jì):我們發(fā)現(xiàn),讓它們獨(dú)立思考,最后再將結(jié)果匯總給指揮官,能得到最棒的效果。
Angela Jiang:完美的“多智能體”運(yùn)作。接下來(lái),我們把“目標(biāo)導(dǎo)向(Outcomes)”加進(jìn)去。我們的客戶(hù)對(duì)接下來(lái)的任務(wù)有極其苛刻的驗(yàn)收標(biāo)準(zhǔn)。我們希望客戶(hù)能用最直白的方式定義這些標(biāo)準(zhǔn),然后我們派出一個(gè)“閱卷智能體(Grader agent)”,死死盯住結(jié)果。其實(shí),“目標(biāo)導(dǎo)向”的配置只需要一個(gè)極其簡(jiǎn)單的 Markdown 文件。大家看這個(gè)文件,一點(diǎn)都不復(fù)雜,上面清晰列出了任務(wù)成功的硬指標(biāo):無(wú)人機(jī)必須軟著陸;著陸點(diǎn)地勢(shì)必須平坦;最關(guān)鍵的一點(diǎn),必須保留足夠的返程燃料,確保無(wú)人機(jī)能安全回到地球。為了將這份評(píng)分標(biāo)準(zhǔn)注入系統(tǒng),我現(xiàn)在向會(huì)話(huà)發(fā)送一個(gè)事件,把這套標(biāo)準(zhǔn)確立為我們的“目標(biāo)導(dǎo)向”。
Katelyn Lesse:在運(yùn)行時(shí),就像 Angela 提到的,系統(tǒng)在后臺(tái)單獨(dú)切出了一個(gè)“閱卷人”。這個(gè)閱卷智能體會(huì)在整個(gè)會(huì)話(huà)過(guò)程中冷酷地進(jìn)行評(píng)估:這次的執(zhí)行是否達(dá)標(biāo)了?當(dāng)然,系統(tǒng)有可能一把過(guò)(one-shot),但更大概率它需要經(jīng)過(guò)幾輪試錯(cuò)和迭代。大家看 Angela 高亮的地方,你可以自行設(shè)定允許它迭代的最大次數(shù)。
Angela Jiang:現(xiàn)在我們集齊了多智能體和目標(biāo)導(dǎo)向,是時(shí)候跑一跑測(cè)試了。客戶(hù)給了我們 6 個(gè)潛在著陸點(diǎn)的數(shù)據(jù),讓我們跑模擬看看情況。我現(xiàn)在切到 Lumara 的控制臺(tái)界面,大家可以看到我針對(duì)這 6 個(gè)點(diǎn)運(yùn)行了模擬。
Katelyn Lesse:成績(jī)相當(dāng)不錯(cuò)。這是整個(gè)系統(tǒng)第一次跑出來(lái)的結(jié)果。融合了多智能體架構(gòu)和目標(biāo)導(dǎo)向功能后,大家可以看到,6 個(gè)地點(diǎn)里它完美搞定了 4 個(gè)。但在 3 號(hào)和 4 號(hào)點(diǎn)位上,顯然還差了點(diǎn)火候。作為兩個(gè)合格的創(chuàng)始人,我們骨子里就有種想要優(yōu)化系統(tǒng)、不斷攀峰(hill climbing)的沖動(dòng)。通常來(lái)說(shuō),持續(xù)優(yōu)化是一個(gè)非常折磨人的過(guò)程,你得拆解大量的邏輯。但今天我們要演示,只需用“模型造夢(mèng)(Dreaming)”功能,優(yōu)化就是彈指一揮間的事。
Angela Jiang:昨天跑完模擬后,我們對(duì)結(jié)果不滿(mǎn)意。于是我們進(jìn)入了 Claude 開(kāi)發(fā)者控制臺(tái)的“造夢(mèng)(Dreaming)”界面。大家看,我只需要點(diǎn)一下這個(gè)寫(xiě)著“Dream”的小按鈕,選擇一個(gè)記憶庫(kù)。隨后,一個(gè)專(zhuān)門(mén)負(fù)責(zé)造夢(mèng)的智能體會(huì)去翻閱所有歷史的模擬會(huì)話(huà),把學(xué)到的血淚教訓(xùn)全部寫(xiě)進(jìn)記憶里。這樣,當(dāng)我們今天再跑新會(huì)話(huà)時(shí),系統(tǒng)就能直接調(diào)用這些深刻的教訓(xùn)了。我昨晚讓它做了一場(chǎng)夢(mèng),這就是它昨晚沉淀下來(lái)的東西。它往記憶庫(kù)里寫(xiě)了大量的認(rèn)知,太震撼了。最核心、最關(guān)鍵的是,這個(gè)智能體居然主動(dòng)撰寫(xiě)了一份“降落攻略(descent playbook)”!這意味著我們未來(lái)跑的所有任務(wù),都能把這套攻略當(dāng)作外掛來(lái)用。這份攻略里甚至包含了它從以往任務(wù)中提煉出的極具前瞻性的啟發(fā)式算法(heuristics)。這是一份極其硬核的降落寶典。昨晚做完夢(mèng)后,我今天早上回到 Lumara 的控制臺(tái),在升級(jí)后的系統(tǒng)上重新跑了一次模擬。
Katelyn Lesse:太絕了!我們不僅成功實(shí)現(xiàn)了系統(tǒng)優(yōu)化(hill climb),之前表現(xiàn)優(yōu)異的指標(biāo)一點(diǎn)沒(méi)掉,反而是那兩個(gè)拖后腿的著陸點(diǎn),這次表現(xiàn)堪稱(chēng)完美。而為了完成這種深度的優(yōu)化,我們付出的努力僅僅是讓 Angela 在控制臺(tái)里點(diǎn)了一個(gè)叫“Dream”的按鈕。
Angela Jiang:完美。讓我們總結(jié)一下:今天我們?cè)诂F(xiàn)場(chǎng)演示里給大家看的所有東西,都已經(jīng)上線了 Claude 平臺(tái),大家現(xiàn)在就可以去用。“多智能體協(xié)同”、“目標(biāo)導(dǎo)向”、“模型造夢(mèng)”——這三板斧讓 Claude 托管智能體(Managed Agents)變得前所未有的強(qiáng)大。你可以用它來(lái)搭建具有深度思考能力、能在生產(chǎn)環(huán)境中規(guī)模化部署的智能體系統(tǒng)。無(wú)論你是要在月球上全自動(dòng)降落無(wú)人機(jī),還是想打造下一個(gè)商業(yè)帝國(guó),Claude 托管智能體都在你身邊,幫你搭建業(yè)務(wù)護(hù)城河,解決那些曾經(jīng)無(wú)解的難題。現(xiàn)在,我們把舞臺(tái)交給 Cat 和 Boris,他們會(huì)告訴你,Claude Code 是如何讓寫(xiě)代碼這件事重新變得性感又好玩的。
Cat Wu:謝謝。Angela 和 Katelyn 剛剛向大家展示了,Claude 平臺(tái)是如何彌合“模型能力”與“企業(yè)實(shí)際落地的智能體”之間的落差的。在 Claude Code 團(tuán)隊(duì),我們也面臨著一個(gè)相似的挑戰(zhàn):我們想要彌合“模型的極限潛能”與“每一位開(kāi)發(fā)者實(shí)際能用它做到什么”之間的落差。
首先,我想對(duì)在座的所有開(kāi)發(fā)者說(shuō)聲謝謝。感謝你們?cè)?Sonnet 3.7 還是最強(qiáng)模型、當(dāng)我們的產(chǎn)品還有些粗糙的時(shí)候,就敢把 Claude Code 接入你們的生產(chǎn)數(shù)據(jù)庫(kù)。你們的支持,是我們團(tuán)隊(duì)每天像打了雞血一樣沖進(jìn)辦公室、拼命迭代 Claude Code 的動(dòng)力。
讓我們從 Claude Code 為什么存在說(shuō)起。軟件開(kāi)發(fā)的形態(tài)正在被實(shí)時(shí)重構(gòu)。Claude Code 的使命,就是替大家掃平從“一個(gè)絕妙的點(diǎn)子”到“把產(chǎn)品推向市場(chǎng)”之間的所有障礙。為了實(shí)現(xiàn)這一目標(biāo),我們打造了能榨干模型前沿算力的工具,并將它無(wú)縫遞到每一位構(gòu)建者的手中。我們并不覺(jué)得手里已經(jīng)攥著一張畫(huà)好的完美路線圖去指導(dǎo)大家;相反,我們更像是并肩攀巖的隊(duì)友,與大家一起向著無(wú)人涉足的險(xiǎn)峰進(jìn)發(fā),在實(shí)踐中摸爬滾打,探索通途。我們與你們一同成長(zhǎng),伴隨 AI 能力的爆發(fā)一同前行,并肩跨越那些未知的挑戰(zhàn)。
我還記得一年前,我給 Claude Code 布置一個(gè)任務(wù)后,我會(huì)死死盯著它試圖修改的每一行代碼。我會(huì)對(duì)每一個(gè)權(quán)限請(qǐng)求彈窗進(jìn)行極其苛刻的審查,不厭其煩地告訴它哪里好哪里不好。我就像牽著學(xué)步孩童的手一樣,一步步牽著它,直到結(jié)果符合預(yù)期。有時(shí)一個(gè)稍微復(fù)雜點(diǎn)的任務(wù),我得點(diǎn)上 100 甚至 200 次確認(rèn),才能拿到最終成果。但現(xiàn)在呢?你們中的絕大多數(shù)人都掛上了“自動(dòng)擋(auto mode)”。你們直接把權(quán)限下放給 Claude,自己去喝杯咖啡,等它干完一大票活、拋出一個(gè) PR(拉取請(qǐng)求)的時(shí)候,再去瞅一眼。
在過(guò)去的一年里,我們大大拓寬了大家使用 Claude 的場(chǎng)景。我們從終端(Terminal)起步,打入了 IDE(集成開(kāi)發(fā)環(huán)境),現(xiàn)在,我們又推出了桌面版。起初只有 CLI(命令行界面),這依然是骨灰級(jí)硬核玩家的心頭好,他們喜歡極簡(jiǎn)的純文本界面,追求絕對(duì)的控制權(quán)和自定義能力。接著我們推出了 IDE 插件,因?yàn)楹芏嚅_(kāi)發(fā)者希望保留強(qiáng)大的智能體,但同時(shí)想在編輯器里直觀地追蹤每一行代碼的變更。最后,基于大家對(duì)更直觀的可視化交互的強(qiáng)烈呼聲,我們知道下一步該往哪走了。
我們發(fā)布了全新的載體:Claude Code 桌面版。它專(zhuān)為那些渴望沉浸式大屏圖形界面的開(kāi)發(fā)者量身定制。它內(nèi)置了預(yù)覽功能,你可以眼睜睜看著 Claude 把你的 App 一行行搭起來(lái);側(cè)邊欄充當(dāng)了你的“艦隊(duì)控制塔”,你可以俯瞰所有的智能體;它還支持渲染圖像和富文本輸出。我們把桌面版設(shè)計(jì)成了一個(gè)絕對(duì)的“中控臺(tái)”,不僅能管理你本地的會(huì)話(huà),連云端遠(yuǎn)程的會(huì)話(huà)也能盡收眼底。哪個(gè)智能體卡殼了,哪個(gè)準(zhǔn)備就緒了,一目了然。順便說(shuō)一句,無(wú)論是 IDE 插件還是桌面版,底座都是 Claude Agent SDK——這正是你們中許多人已經(jīng)在用的那個(gè) SDK。
很多企業(yè)已經(jīng)讓 Claude Code 的工具全員覆蓋(wall-to-wall)。在我們 Anthropic 內(nèi)部,這讓每位工程師產(chǎn)出的 PR 數(shù)量暴增了 200%,同時(shí)代碼質(zhì)量的紅線沒(méi)有絲毫降低,而這還是在我們工程團(tuán)隊(duì)規(guī)模急劇擴(kuò)張的背景下實(shí)現(xiàn)的。我們正與大家一起,在重新定義“軟件工程”未來(lái)的模樣。既然面對(duì)的是全新的挑戰(zhàn),我們決定用 Claude 驅(qū)動(dòng)的自動(dòng)化魔法去一一攻克它們。
我給大家過(guò)幾招。以下是我們聽(tīng)取社區(qū)反饋后,與大家共同打磨出的利器。
你們反饋說(shuō),代碼審查(Code Review)太耗時(shí)間了。于是我們推出了“代碼審查器”。它會(huì)派出一支智能體特種部隊(duì),替你死磕那些致命的 Bug。現(xiàn)在成千上萬(wàn)家公司每天都在用它,包括我們 Anthropic 所有的內(nèi)部團(tuán)隊(duì)。
你們反饋說(shuō),想隨時(shí)隨地寫(xiě)代碼。于是我們推出了“遠(yuǎn)程控制”,并把 Claude Code 塞進(jìn)了 iOS 和 Android 的 Claude App 里。靈感一來(lái),隨時(shí)隨地發(fā)起任務(wù)。你再也不用端著個(gè)處于休眠邊緣的筆記本在走廊里晃悠,也不用被死死釘在辦公桌前。你現(xiàn)在完全可以去公園散個(gè)步,摸摸草地,同時(shí)代碼還能繼續(xù)跑。
你們反饋說(shuō),在 CI(持續(xù)集成)測(cè)試失敗、處理審查意見(jiàn)、解決代碼沖突上耗費(fèi)了太多心血,簡(jiǎn)直成了 PR 的保姆。于是我們加了“自動(dòng)修復(fù)(Auto-fix)”。它就像個(gè)隱形哨兵,監(jiān)聽(tīng)這些事件,一旦有錯(cuò)它主動(dòng)提補(bǔ)丁,確保你的 PR 永遠(yuǎn)是一片賞心悅目的綠色。
你們反饋說(shuō),每次有新的 Jira 工單或者客戶(hù)報(bào) Bug,你們都得手動(dòng)召喚 Claude Code 去處理。于是我們想,為什么不搞個(gè)“Routines(例程)”呢?配置一次,一勞永逸。無(wú)論是監(jiān)聽(tīng) Webhook、API 事件,還是定時(shí)執(zhí)行,它都會(huì)自動(dòng)幫你把 Claude Code 喚醒。不再需要人工干預(yù),交給 Claude 就行。
最后,你們反饋說(shuō),功能迭代太快了,連你們自己的安全團(tuán)隊(duì)都查不過(guò)來(lái)了。于是我們開(kāi)發(fā)了“Claude Security”。它會(huì)在夜深人靜時(shí)掃描你們整個(gè)代碼庫(kù),一旦嗅到漏洞,自動(dòng)喚醒 Claude Code 去進(jìn)行修復(fù)。
所有的這些原語(yǔ)組合在一起,構(gòu)筑了抵御未來(lái)工程風(fēng)暴的城墻。我剛才提到的這一切,今天大家全都能用上。最讓我感到興奮的是,很多公司在整個(gè)組織的維度上,徹底接納并應(yīng)用了這套體系。
先說(shuō)說(shuō) Shopify。他們支撐著全球數(shù)以百萬(wàn)計(jì)商家的電商帝國(guó)。他們把 AI 的血液注入了整個(gè)工程組織的動(dòng)脈,甚至改變了公司的文化基因。在 Shopify,Claude Code 是全員標(biāo)配,不僅工程師在用,設(shè)計(jì)、產(chǎn)品、數(shù)據(jù)科學(xué)團(tuán)隊(duì)也在用。他們把它直接織進(jìn)了自己的平臺(tái),以驚人的規(guī)模構(gòu)建內(nèi)部工具。他們的應(yīng)用 AI 總監(jiān) Andrew McNamara 是這么評(píng)價(jià)的:“速度簡(jiǎn)直快到離譜。Claude Code 徹底重塑了我們構(gòu)建內(nèi)部工具的范式。”
再看 Mercado Libre(美客多),拉美最大的電商霸主,服務(wù)上億買(mǎi)家。他們有一支兩萬(wàn)三千人的工程師大軍,所有人都在用 Claude Code 運(yùn)行項(xiàng)目。當(dāng)這種規(guī)模的組織發(fā)生質(zhì)變時(shí),工作的形態(tài)就徹底變了。工程師們開(kāi)始把智能體像巡航導(dǎo)彈一樣,瞄準(zhǔn)那些常年無(wú)人問(wèn)津、根本沒(méi)時(shí)間去管的陳年技術(shù)債。在人類(lèi)的監(jiān)督下,它已經(jīng)審查了超過(guò) 50 萬(wàn)個(gè) PR,翻新了超過(guò) 9000 個(gè)應(yīng)用程序。他們的技術(shù)負(fù)責(zé)人 Oscar Mullin 立下了一個(gè) Flag:在今年第三季度,實(shí)現(xiàn) 90%的自動(dòng)化編碼和全智能體驅(qū)動(dòng)的 PR 循環(huán)。
在整個(gè)行業(yè)中,類(lèi)似的聲音不絕于耳。但我最喜歡的其實(shí)不是這組數(shù)字,而是我們?cè)诮涣鲿r(shí)發(fā)現(xiàn),很多經(jīng)理、甚至是 VP 級(jí)別的高管,又重新挽起袖子,親自下場(chǎng)去代碼庫(kù)里“弄臟雙手”了。Claude Code 把寫(xiě)代碼的樂(lè)趣,重新交還給了那些過(guò)去十幾年只看路線圖和做審查的高管手中。這在整個(gè)行業(yè)都在發(fā)生。數(shù)以百萬(wàn)計(jì)的開(kāi)發(fā)者正在以比過(guò)去更高的質(zhì)量,交付海量的產(chǎn)品。
說(shuō)了這么多,這玩意兒跑起來(lái)到底是什么感覺(jué)?讓我們掌聲有請(qǐng) Claude Code 業(yè)務(wù)負(fù)責(zé)人 Boris Cherny 帶大家一探究竟!
Boris Cherny:在開(kāi)始演示之前,我想先掏下心窩子。今天我們展示的所有東西,對(duì)我來(lái)說(shuō)依然充滿(mǎn)著魔力感。我每天都在倒騰 Claude Code,哪怕在 Anthropic 內(nèi)部,我們也經(jīng)常互相甩截圖,驚嘆大家用 Claude 做出的各種騷操作。老實(shí)說(shuō),能和大家在這個(gè)探索的旅程中同行,我感到無(wú)比興奮。
今天,我非常激動(dòng)能再給大家展示幾個(gè)硬核案例。很遺憾,我們不能所有人都去造月球無(wú)人機(jī)。所以在接下來(lái)的演示中,假設(shè)我們是 Acme Pay(一家支付基礎(chǔ)設(shè)施公司)的工程師。我們啟動(dòng) Claude 桌面版。首先從一個(gè)單線任務(wù)開(kāi)始。在這個(gè)會(huì)話(huà)中,Claude 的任務(wù)是給 Acme 的商戶(hù)后臺(tái)添加一個(gè)“退款”功能。它正在構(gòu)建一套全量的實(shí)現(xiàn)邏輯:包含冪等性(idempotency),防止重復(fù)的 Webhook 讓商戶(hù)被扣兩次錢(qián);涵蓋 Acme 所有運(yùn)營(yíng)區(qū)域的多幣種處理機(jī)制;以及為合規(guī)團(tuán)隊(duì)準(zhǔn)備的審計(jì)日志。它寫(xiě)完了代碼,現(xiàn)在準(zhǔn)備自己驗(yàn)證自己的工作。Claude 調(diào)起了商戶(hù)后臺(tái),觸發(fā)了一筆退款。啊哦,界面上沒(méi)有彈出成功提示(success toast)。這是一個(gè)極其隱蔽的邊緣測(cè)試用例。Claude 捕捉到了這個(gè)失敗,順藤摸瓜,發(fā)現(xiàn)問(wèn)題出在樂(lè)觀更新(optimistic update)的競(jìng)態(tài)條件上。它動(dòng)手修補(bǔ)了邏輯。在它判定任務(wù)完成之前,它甚至?xí)跒g覽器里再跑一遍驗(yàn)證。
現(xiàn)在,讓我們把視角拉遠(yuǎn)。這個(gè)會(huì)話(huà)并不是在孤軍奮戰(zhàn)。它只是無(wú)數(shù)個(gè)同時(shí)并行運(yùn)行、被同時(shí)管理的會(huì)話(huà)之一。在 Claude 桌面版中,你現(xiàn)在可以開(kāi)啟“上帝視角”,俯瞰你所有的 Claude Code 會(huì)話(huà)。哪個(gè)正在狂奔,哪個(gè)卡住了需要你拍板,哪個(gè)已經(jīng)提了 PR 并合并完畢,盡收眼底。“盯著它一行行寫(xiě)代碼”這種同步編碼模式,將只是未來(lái)開(kāi)發(fā)場(chǎng)景中的冰山一角。我們堅(jiān)信,未來(lái)的趨勢(shì)是,海量的代碼將以“異步”的方式被生產(chǎn)出來(lái)。這就是為什么我們死磕“自主驗(yàn)證(verification)”的原因。如果 Claude 能自己檢查自己的作業(yè),你完全可以讓它去跑,自己去干別的事,回來(lái)直接驗(yàn)收完美運(yùn)行的成果。
就拿我個(gè)人來(lái)說(shuō),我現(xiàn)在大部分的代碼,其實(shí)都是 Routines(例程)幫我寫(xiě)的。我不再親自給 Claude 寫(xiě)提示詞了,我的工作變成了“創(chuàng)建一個(gè)去給 Claude 下發(fā)提示詞的 Routine”。在座的各位工程師,大家可以把它理解為“高階函數(shù)(higher-order function)”。而 Routines,就是一種高階提示詞。就拿剛才那個(gè)“退款功能”的演示來(lái)說(shuō)吧,其實(shí)是一個(gè)同事大半夜在 GitHub 上提了個(gè) Issue。一直在后臺(tái)監(jiān)聽(tīng)代碼庫(kù)的 Routine 逮住了這個(gè)更新,異步喚醒了 Claude,把活兒派給了它。有了 Routines,開(kāi)發(fā)者可以布下天羅地網(wǎng)的異步自動(dòng)化機(jī)制,然后每天早上醒來(lái),看著一堆準(zhǔn)備好被 Merge 的 PR 喝咖啡。這就是我們的 Routines 管理界面。你可以讓它定時(shí)跑,可以通過(guò) Webhook 喚醒它,甚至可以通過(guò)隨意的 API 調(diào)用去觸發(fā)它。它不僅能跑在你的本地機(jī)器上,還能跑在遠(yuǎn)端云服務(wù)器上。
我們?cè)倏醋詈笠粋€(gè)功能。也就是 Cat 剛才提到的“CI 自動(dòng)修復(fù)”。它的任務(wù),就是給剛才上一個(gè)會(huì)話(huà)提交的 PR 當(dāng)保姆。它要一路護(hù)送這個(gè) PR 殺進(jìn)生產(chǎn)環(huán)境。代碼審查和安全審查甩過(guò)來(lái)的修改意見(jiàn)?它自動(dòng)修復(fù)。CI 飄紅了?它自動(dòng)修復(fù)。代碼合并不了起沖突了?它自動(dòng) Rebase。大家看剛才發(fā)生了什么:CI 因?yàn)榫W(wǎng)絡(luò)超時(shí)閃退了。Routine 秒醒,把脈發(fā)現(xiàn)這是個(gè)已知的基建網(wǎng)絡(luò)抖動(dòng),直接重跑了任務(wù),綠燈放行。說(shuō)個(gè)秘密,其實(shí)在 Claude Code 自己的代碼庫(kù)里,我們不僅讓它重試,我們還要求它每次都去順手把根本原因給修了。這樣一來(lái),負(fù)責(zé)這個(gè) PR 的工程師這輩子都不會(huì)看到令人窒息的紅叉。這部分爛攤子,徹底從他們肩上卸下來(lái)了。
這就是范式的轉(zhuǎn)變。默認(rèn)的操作不再是“我要去給 Claude Code 寫(xiě)提示詞”,而是“我要讓 Claude 去給 Claude Code 寫(xiě)提示詞”。剛才大家看到的這些,包括 Routines 和最新版的 Claude 桌面端,今天全量上線。我們已經(jīng)迫不及待想看大家上手把玩,并聽(tīng)到你們的反饋了。我們希望這些功能,能徹底抹平你的靈感與產(chǎn)品上線之間的鴻溝。
今天所有的演講,其實(shí)都在指著同一個(gè)方向。Dianne 展示的能力躍升曲線,Angela 和 Katelyn 演示的會(huì)自我評(píng)分、自我進(jìn)化的智能體,以及 Cat 和我剛剛向大家秀的肌肉。這是同一個(gè)故事的三個(gè)切面。模型的能力已然降臨,剩下的唯一懸念,是我們用多快的速度把它投入戰(zhàn)場(chǎng)。我強(qiáng)烈建議大家在接下來(lái)的時(shí)間里,盡情去探索這三個(gè)層面:如果你在評(píng)估模型,去聽(tīng)研究團(tuán)隊(duì)的分享;如果你在為用戶(hù)構(gòu)建系統(tǒng),去參加 Claude 平臺(tái)的環(huán)節(jié);如果你想把 Claude 深植于日常的開(kāi)發(fā)流,就去 Claude Code 的工作坊。一頭扎進(jìn)去,深挖它,和我們一起構(gòu)建未來(lái)吧。謝謝大家!
(投稿或?qū)で髨?bào)道:zhanghy@csdn.net)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.