![]()
(來(lái)源:麻省理工科技評(píng)論)
Anthropic 的開(kāi)發(fā)者活動(dòng) Code with Claude 于 5 月 19 日在倫敦開(kāi)幕,為期兩天,和 Google 在帕洛阿爾托舉辦的 I/O 大會(huì)撞在了同一天。
“在座有多少人上周提交過(guò)一個(gè)完全由 Claude 寫(xiě)的 pull request?”Anthropic 工程師杰里米·哈德菲爾德(Jeremy Hadfield)在主舞臺(tái)上問(wèn)。很多人膝蓋上放著筆記本電腦,一邊聽(tīng)演講一邊寫(xiě)代碼或跟 AI 對(duì)話(huà);滿(mǎn)滿(mǎn)一屋子的人,將近一半舉起了手。
Pull request 是對(duì)現(xiàn)有軟件提交的修復(fù)或更新,提交后需要經(jīng)過(guò)審核才能上線(xiàn)。這是軟件開(kāi)發(fā)的日常,是大多數(shù)專(zhuān)業(yè)程序員一輩子都在寫(xiě)的東西——至少以前是。
“有多少人提交過(guò)完全由 Claude 寫(xiě)的 pull request,而且自己根本沒(méi)看過(guò)里面的代碼?”哈德菲爾德接著問(wèn)。現(xiàn)場(chǎng)傳來(lái)緊張的笑聲,大部分手沒(méi)有放下來(lái)。
LLM 驅(qū)動(dòng)的工具——比如 Anthropic 的 Claude Code 和 OpenAI 的 Codex——已經(jīng)顛覆了軟件開(kāi)發(fā)的方式,這不是新聞了。頭部科技公司現(xiàn)在喜歡比誰(shuí)的開(kāi)發(fā)者手寫(xiě)代碼更少。“Anthropic 的大部分軟件現(xiàn)在都由 Claude 編寫(xiě),”哈德菲爾德說(shuō),“Claude Code 里的大部分代碼也是 Claude 自己寫(xiě)的。”O(jiān)penAI、Google 和微軟也有類(lèi)似的說(shuō)法。
即便如此,這種新范式已經(jīng)被視為理所當(dāng)然的速度還是令人吃驚。這是 Anthropic 第二年舉辦開(kāi)發(fā)者活動(dòng),活動(dòng)也在舊金山和東京舉行。去年這個(gè)時(shí)候公司剛發(fā)布 Claude 4,那時(shí)候它勉強(qiáng)能寫(xiě)代碼。但經(jīng)過(guò)最近一連串更新——尤其是今年 2 月發(fā)布的 Claude 4.6 和 4 月發(fā)布的 4.7——Claude Code 已經(jīng)成為越來(lái)越多開(kāi)發(fā)者樂(lè)意把活交出去的工具。
Anthropic 說(shuō)他們的目標(biāo)是把自動(dòng)化推到極致。不是讓 AI 生成代碼、再由人類(lèi)來(lái)清理和修復(fù)錯(cuò)誤,而是讓 Claude 自己檢查和修正自己的工作。“默認(rèn)做法不再是‘我來(lái)給 Claude 寫(xiě)提示詞’,而是‘讓 Claude 自己給自己寫(xiě)提示詞’。”Claude Code 負(fù)責(zé)人鮑里斯·切爾尼(Boris Cherny)在開(kāi)場(chǎng)演講中說(shuō)。
如果一切順利,出了錯(cuò)人類(lèi)開(kāi)發(fā)者甚至不需要看到報(bào)錯(cuò)信息。那些都由 Claude 來(lái)處理——測(cè)試、調(diào)整、再測(cè)試、再調(diào)整,直到一切正常運(yùn)行。Anthropic 工程師拉維·特里維迪(Ravi Trivedi)在另一場(chǎng)演講中說(shuō):“核心原則就是別擋 Claude 的路。我們喜歡說(shuō)的一句話(huà)是:‘讓它自己搞。’”
特里維迪介紹了 Claude Code 兩周前宣布的一個(gè)新功能,Anthropic 稱(chēng)之為“做夢(mèng)”(dreaming)。Claude Code 智能體會(huì)給自己寫(xiě)筆記,記錄和保存關(guān)于特定任務(wù)的有用信息。之后另一個(gè)編程智能體接手同一段代碼時(shí),可以讀這些筆記來(lái)更快上手,并從前一個(gè)智能體犯過(guò)的錯(cuò)誤中學(xué)習(xí)。
“做夢(mèng)”是 Claude Code 用來(lái)通讀所有這些筆記并整合信息的機(jī)制,它能發(fā)現(xiàn)不同任務(wù)之間的共同模式和常見(jiàn)問(wèn)題。理論上,這應(yīng)該讓 Claude Code 越來(lái)越熟悉某個(gè)特定的代碼庫(kù),在上面工作得越來(lái)越好。
Code with Claude 是一場(chǎng)面向開(kāi)發(fā)者的活動(dòng)。除了 Anthropic 自己的產(chǎn)品展示和實(shí)操工作坊,還有一批企業(yè)分享了它們?nèi)绾螄@ Claude Code 重組軟件開(kāi)發(fā)團(tuán)隊(duì)的經(jīng)驗(yàn),包括 Spotify 和 Delivery Hero,以及 Lovable、Base44 和 Monday.com——后面三家是幫人用 AI 寫(xiě)代碼來(lái)做 App 的初創(chuàng)公司(沒(méi)錯(cuò),用 AI 寫(xiě)代碼的工具本身也是用 AI 寫(xiě)代碼做出來(lái)的)。
Code with Claude 現(xiàn)場(chǎng)看不到任何不安的跡象,我遇到的每個(gè)人都想擁抱這個(gè)趨勢(shì)。
但在會(huì)場(chǎng)之外,已經(jīng)有不少報(bào)道說(shuō)很多程序員開(kāi)始質(zhì)疑這個(gè)光明新未來(lái)。有人在 Reddit 和 Hacker News 等論壇上抱怨:AI 編程工具是被追求生產(chǎn)力提升的管理層強(qiáng)推的,實(shí)際用起來(lái)反而讓軟件開(kāi)發(fā)變得更難了,因?yàn)楝F(xiàn)在開(kāi)發(fā)者要額外審查大量 AI 生成的代碼。“我聽(tīng)到的所有說(shuō)‘AI 生成的代碼沒(méi)問(wèn)題’的人,都是那些不讀代碼的人,”一個(gè)叫 pron 的用戶(hù)上周在 Hacker News 上寫(xiě)道。
還有人說(shuō)隨著越來(lái)越多的任務(wù)交給 AI,自己的編程能力正在退化。研究人員也警告說(shuō),AI 工具可能生成不安全的代碼,讓軟件更容易被攻擊。
我跟 Claude 的工程負(fù)責(zé)人凱特琳·萊瑟(Katelyn Lesse)和產(chǎn)品負(fù)責(zé)人安吉拉·姜(Angela Jiang)坐下來(lái)聊了聊。我問(wèn)她們?cè)趺纯催@種擔(dān)憂(yōu):大量 AI 生成的代碼在沒(méi)有充分人工審查的情況下就被提交上線(xiàn),會(huì)不會(huì)把嚴(yán)重的安全和維護(hù)問(wèn)題留給未來(lái)?
“所有過(guò)去的軟件開(kāi)發(fā)最佳實(shí)踐仍然適用,一直都適用,”萊瑟說(shuō),“我覺(jué)得有很多人和團(tuán)隊(duì)在這股浪潮中把這些給忘了。”
但隨著 Anthropic 等公司推動(dòng)更深入的自動(dòng)化、Claude Code 等工具越來(lái)越強(qiáng),把更多任務(wù)甚至包括審查環(huán)節(jié)都交出去的誘惑也在增大。萊瑟告訴我,Anthropic 內(nèi)部一些技術(shù)主管已經(jīng)被團(tuán)隊(duì)現(xiàn)在產(chǎn)出的海量代碼搞得精疲力竭。“事情發(fā)生得快了這么多,光是管理時(shí)間就是一個(gè)挑戰(zhàn)。”她說(shuō)。
“我覺(jué)得目前 Claude 寫(xiě)代碼的水平大概相當(dāng)于一個(gè)中級(jí)工程師。”她補(bǔ)充道。你仍然需要資深工程師來(lái)設(shè)計(jì)系統(tǒng)架構(gòu)、解決更難的問(wèn)題,“但隨著時(shí)間推移,我們希望 Claude 在各種工程任務(wù)上都越來(lái)越強(qiáng)。”
姜表示同意:“我覺(jué)得我們追求的終極狀態(tài),是 Claude 基本上能夠自己造自己。”
https://www.technologyreview.com/2024/10/28/1106251/this-ai-system-makes-human-tutors-better-at-teaching-children-math/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.