<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      代碼產出暴漲250%,Claude Code已100%由自己編寫!CC 之父 Boris 最新對話:我現在只負責寫提示詞

      0
      分享至


      “我現在只用 Claude 指揮其他 Claude。”

      整理 | 王啟隆

      出品丨AI 科技大本營(ID:rgznai100)

      最近這一兩個月,硅谷正陷入一場被稱為“刷 Token(Tokenmaxxing)”的狂熱中——算力已徹底取代期權和底薪,成為“第四種薪酬體系”。很多AI 巨頭內部甚至設立了“token 消耗量排行榜”來掛鉤生產力,逼得亞馬遜等公司的部分員工不得不每天運行無效的自動化程序來刷量湊數,而單周燒掉 2100 億個 Token、單月悄悄跑掉 15 萬美元 API 賬單的極端數字,更是層出不窮。

      在這場技術狂飆的中心,Anthropic 的年度經常性收入(ARR)據傳已從一年前的 40 億美元暴增至450 億美元,市場需求同比猛增了 80 倍。親手為這場瘋狂提供核心燃料的人之一,正是 Claude Code 的負責人Boris Cherny


      這位曾在 Meta(Facebook)擔任首席軟件工程師長達六年、深度負責過 Instagram 服務器架構擴展的技術專家,在編程界更為人熟知的身份是全球暢銷書《Programming TypeScript》的作者。2024 年 11 月,Boris 卻做出了一個在外人看來近乎“技術背叛”的決定:在個人工作流中徹底停用手動代碼編寫。如今,他所主導的 Claude Code 乃至其全線產品,自身代碼已 100% 由機器自動編寫與演化

      前幾天,Boris 坐進了 Big Technology Podcast 的演播室,與主持人 Alex 展開了一場細致而冷靜的硬核對話。


      金句速覽

      • “我不再寫代碼,我只指揮 Claude 去向其他 Claude 下達指令”。

      • “如果你教這個東西去預測下一個詞,但不知何故,只要下一個詞的難度足夠高,模型在最底層就必須被迫學會如何深謀遠慮和精密推理”。

      • 在過去的工程時代,耗費巨大人力提升 1% 到 3% 的代碼健康度便已是極限。但在 AGI 前夜,引入 Claude Code 使得 Anthropic 每個工程師編寫的代碼量直接暴增了 250%,且沒有犧牲任何系統可靠性指標

      • 企業切忌過早去優化 Token 成本,而是應當給予員工犯錯的安全感。如今打破行業效率天花板的,往往不再是高薪雇傭的核心技術精英,反而可能是原本沒有任何編程經驗、卻利用智能體把自身業務自動化掉的營銷人員、會計,乃至醫生與電工。

      以下為本次訪談的對話實錄:

      「AI 科技大本營讀者專屬福利」

      免費領100小時云算力券·支持主流 AI 框架與模型部署

      咖啡領取地址: https://s.csdn.cn/4nPsOp


      “我以前從未見過如此陡峭的增長”

      主持人:先來聊聊 Claude Code 的增長吧。它的增長規模是極其龐大的,我記得在最近的一次活動上,Anthropic 的 CEO 達里奧·阿莫代伊(Dario Amodei)提到,市場對 Anthropic 產品的需求同比暴增了 80 倍。

      我還記得去年這個時候和他交談時,他因為 Anthropic 達到了 40 億美元的年度經常性收入(ARR)而激動不已。但現在回看,那個數字簡直不值一提。目前的數字據說可能已經達到了 450 億美元,整整翻了十倍,需求漲了 80 倍。

      現在的問題是,公司的服務能力跟不跟得上這種需求。跟我們說說 Claude Code 在這龐大需求中占據了多大比重,以及你觀察到的需求增長情況,還有這款產品是如何被世界上越來越多的人使用的?

      Boris Cherny:我覺得,人們使用 AI 智能體(Agent)和使用 AI 的方式正在發生改變,這不僅僅體現在 Anthropic 的產品上,尤其體現在 Claude Code 上。當然,Anthropic 旗下有很多不同的產品,比如 Claude Code、Claude Chat、Claude Design、Co-work,還有 API 產品。體驗 Anthropic 技術的途徑有很多。但對很多人來說,Claude Code 是他們接觸我們的第一扇門。

      當我們最初在內部發布它時,使用量瞬間就飆升了。所以,甚至在我們將 Claude Code 向 Anthropic 之外的任何人發布之前,我們就有一種強烈的預感:這絕對會是個爆款。大概在去年五月,我們發布 Opus 4 和 Sonnet 4 的時候,增長曲線直接變成了指數級。我以前從未見過如此陡峭的增長。然后,隨著去年 11 月的 Opus 4.5、今年 2 月的 4.6,再到現在的 4.7,它一次又一次地迎來拐點,指數級增長還在不斷加速。

      我們團隊里有很多在科技行業摸爬滾打多年的老兵,大家都參與過各種超高速增長的產品。在科技圈,人們總是把“獨角獸”和“超高速增長”掛在嘴邊,但老實說,連我們團隊的人都從未見過這樣的增長陣勢。所以我們現在正絞盡腦汁地想,如何才能讓所有人都能繼續順暢地體驗這款產品?如何才能確保我們能維持現在的增速,甚至去迎接未來可能更陡峭的增長曲線?在如何實現這一目標以及如何持續擴展服務規模方面,我們正在摸著石頭過河,也學到了很多。

      主持人:Anthropic AI 模型的大部分使用量都來自 API,對吧?比如一家咨詢公司把它應用到銀行里,銀行再用它來匯總一些計算數據。與 Claude 的聊天機器人相比,API 在使用量、收入等各方面都占據了絕對的大頭。今天還是這樣嗎?還是說 Claude Code 已經后來居上了?

      Boris Cherny:現在是齊頭并進的狀態。對于 Anthropic 來說,C端/B端產品扮演的角色比一年前重要得多。這是毫無疑問的。產品增長正在加速,勢頭非常猛。同時,API 的業務也在加速,增長同樣極快。對我們而言,這兩條線我們都在大力投入。

      我們必須成為一家產品公司,因為對于一個 AI 實驗室來說,打造產品有很多重要的理由。其實在早期,這一點并不明確。在 Anthropic 成立的最早期,甚至在我加入之前,內部還在激烈辯論:我們到底該不該做產品?這真的是件有意義的事嗎?事實證明,它非常有意義,不僅能搶占用戶心智,更重要的是為了安全。

      從根本上說,我們存在的使命是研究 AI 安全。而產品為我們提供了更好的工具來實現這一目標。同時,我們團隊規模不大,世界上絕大多數的應用我們是不可能親自去做的,對吧?這就是為什么我們還必須提供一個平臺,提供托管的智能體、API 和 SDK 等各種產品,讓其他人可以在此基礎上進行開發,而現在也有成千上萬家企業正是這么做的。

      主持人:聽到你用“齊頭并進”來回答這個問題,挺有意思的。我猜你現在是不打算透露哪邊占比更大了。

      Boris Cherny:目前可能還不行。

      主持人:既然你沒有明確說“API 更大”——也許它確實更大,但你用了“齊頭并進”這個詞,這本身就說明 Anthropic 的自營產品正在經歷爆炸式的增長。

      現在我們已經鋪墊好了背景:這是一款呈指數級增長的產品。顯然,我們也看到 Anthropic 的收入隨著這款產品同步呈指數級增長。這是你構思、打造并至今仍在負責的產品。

      我想可能有些觀眾會問:“那么,Claude Code 到底是什么?”我們的大多數觀眾顯然知道它是什么。我原本想,該怎么用一句簡單的話來定義它呢?我寫的是:這是一種用大白話來構建網站和軟件的方式。但在來演播室的路上,我又覺得,這好像有點把它說小了。如果是你,你會怎么描述它?

      Boris Cherny:我覺得這個描述其實挺精準的。

      主持人:好吧,那就采納這個說法。

      Boris Cherny:我覺得,當很多人想到 AI 時,他們腦海中浮現的是聊天機器人。對于工程師來說,在大約一年半前我們開始研發 Claude Code 之前,AI 在他們眼里也就是個聊天機器人。那是當時大多數人對 AI 的認知。但我們在某個時刻意識到,模型在寫代碼和使用工具方面變得極其出色。而這些正是我們一直訓練模型去掌握的能力。這在很長一段時間里都是我們的研究方向。大概在一年半前,這項技術開始具備了真正的商業價值。

      所以在 Claude Code 上,我們下了一個賭注,徹底偏離了當時全世界寫代碼的傳統方式。因為當時所有人寫代碼,本質上都是在使用一個高級的文本編輯器,而我們認為,我們能做的遠不止于此,我們可以創造一種前所未有的全新模式。這絕對是一場豪賭。于是我們推出了 Claude Code。讓 Claude Code 區別于當時所有聊天機器人的核心在于:Claude Code 能夠使用工具。這就是最大的不同。用聊天機器人,你只是在跟它來回對話;但一個智能體(Agent),而 Claude Code 就是一個智能體,它是可以調用你的工具的,對吧?

      主持人:我們能快速界定一下這里的“工具”嗎?如果我理解錯了請糾正我,工具可以是從使用瀏覽器,到登錄 Cloudflare 然后在那邊設置一個智能體的任何東西,對吧?所以,重點不再是這個產品本身能做什么,而是它能登錄什么系統,然后結合網上五花八門的產品替你做什么。

      Boris Cherny:沒錯。它可以連接你所有的各種工具。它能使用你的瀏覽器,能控制你的電腦。甚至像在桌面上編輯一個文件這么簡單的事。一年半前,沒有任何一款 AI 產品能真正做到這一點。但這卻是 Claude Code 最先掌握的能力之一。它可以在你的桌面上編輯文件;如果你的桌面亂七八糟,它可以幫你整理歸類。只要你愿意授權,Claude Code 和 Co-work 就能擁有這種訪問權限。

      這真的很神奇。這看似微小的差別,徹底顛覆了人們使用這款產品的方式,也完全重塑了這款產品能為你創造的價值。

      主持人:我覺得如果要深挖這里的根本邏輯,那就是 AI 似乎已經從一個“超級自動補全機”進化了。因為在最底層,AI 其實就是在預測下一步是什么。如果你把機器學習應用在大型數據集上,它是在預測你是否會拖欠房貸,以及銀行是否該批這筆貸款。在句子里,它是在預測下一個詞。在代碼里,它是在預測序列里的下一段代碼,我覺得那算是第一代的 AI 產品邏輯。

      但你現在談論的是,機器在接到你的自然語言提示后,能夠自己去寫代碼、掛載工具,然后替你把活兒干了。如果我理解錯了請指正,但這里的應用場景似乎已經發生了轉變:一開始是開發者接入 Claude Code 來寫代碼,這群人推動了產品的爆炸式增長;但隨后出現了一股次生力量,那就是像我這樣的非技術人員。我們也可以通過指揮 AI 智能體(也就是 Claude Code)來為自己搭建工作流軟件或網站。或者,通過像 Claude Co-work 這樣可能算作更易上手的“姐妹產品”來接管你的電腦,對它說:“既然你能訪問我的瀏覽器,也知道我喜歡訂什么樣的航班,我幾周后要去印度,幫我把機票訂了吧。”

      Boris Cherny:是的,完全正確。我最近剛好就用 Co-work 訂了一堆機票。這個月我要飛很多地方,因為我們馬上要在倫敦和東京舉辦“Code with Claude”活動,中途還有其他幾站。我當時就跟 Co-work 溝通說:“好的,我需要在這些時間點出現在這些地方。”那是一趟包含五站的長途旅行,要飛很多城市。我告訴它:“這是大致的行程,你去翻翻我的郵件和日歷,幫我核對一下,確保我沒漏掉什么。”結果它查完郵件后,竟然發現我漏了兩站,還有幾個日期我記錯了。然后我讓它去訂機票,接著我就去忙著敲代碼工作了。一小時后我回來,它已經訂好了八趟航班和五家酒店。其中有一家酒店的位置不太對,我讓它重新換一家,它瞬間就搞定了。就這么簡單。

      其實,我每次用 Co-work 和 Claude Code 都會做這類測試。我有一些自己常用的測試用例,隨著模型的升級,我會用不同的模型反復測試這些常見任務。這是我迄今為止得到的最完美的結果。當 Co-work 結合了 Opus 4.7 模型,它在處理這類任務時展現出了一種難以言喻的魔力。

      我覺得對我來說最困難的一點是,隨著模型的不斷進化,你必須不斷重塑自己對它能力的預期。如果你去問一年前用過該模型的人,尤其是工程師,他們可能會說:“哦,它寫代碼不太行,我不敢讓它一次寫超過幾行代碼。”因為一年前的模型確實就是那個水平,它還不夠強大。但如果你把時間快進到今天,讓這些人坐下來試試新模型——現在越來越多的工程師正在這么做——那完全是截然不同的體驗。它的能力已經發生了翻天覆地的變化。

      我覺得這是我用過的第一項每個月都能在能力上實現階躍式突破的技術。作為這項技術的用戶,其實是很有挑戰性的,因為你必須不斷重新學習、不斷重新嘗試。你必須始終保持“空杯心態”,帶著新手的眼光去重新審視這項技術,讓它去嘗試以前它做不好的事情,因為下一個版本的模型可能就能完美搞定了,對吧?


      從引進工具到生產力提升的鴻溝

      主持人:所以我覺得這就是你所描繪的愿景:以前你使用技術時,你是受制于軟件界面的。軟件公司為了規模化而設計產品,結果就是你得到了一堆對你可能毫無用處的功能。即使你很清楚自己想要什么,每次預訂東西時還是得在那些花里胡哨的界面里繞來繞去,而且網站也不會記住你的偏好。

      現在范式轉變了。你擁有了一個智能體,它能主動出擊替你辦事,并能按照你的心意重塑你的在線體驗。我認為這就是人們如此狂熱的原因,也是你們產品爆炸式增長的根源。

      但現在,我想給這個論點做個壓力測試,提出一些讓我感到好奇的問題:這里面到底有多少是真實的剛需,又有多少只是大家對潛力的盲目狂熱,或許我們該面對一下現實。

      第一個問題是,現在的需求確實極其龐大,但問題是,這里面有多少是純粹的真實需求,又有多少是被“游戲化”催生出來的虛假繁榮?在硅谷內外,現在流行一種叫做“刷 Token(Token maxing)”的做法。我確信你聽說過。就是公司下達指令,要求員工盡可能多地運行 AI 智能體來消耗大量的 AI Token。然后,那些消耗 Token 最多的員工會在排行榜上獲得獎勵,或者以此來完成公司規定的“AI 交互指標”(而非實際的物理工作指標)。所以,我想聽聽你對“刷 Token”現象的看法,你覺得這在你們產品的總使用量中占了很大比例嗎?

      Boris Cherny:嗯,我不認為“刷 Token”占了很大的比例。我的看法是這樣的,在加入 Anthropic 之前,我曾在一家大型科技公司工作,也就是 Facebook(Meta)。

      主持人:那可正是目前在搞“刷 Token”的公司之一啊。

      Boris Cherny:沒錯,沒錯。當時我的職責之一,就是負責 Meta 旗下所有應用(比如 Facebook、Instagram、WhatsApp)的代碼健康度。我們之所以關注代碼健康度(本質上就是代碼質量),是因為如果代碼質量極高,工程師的生產力就會提升。我們有一個龐大的團隊專門致力于提升生產力。

      在大模型出現之前,在 Claude 出現之前,你可能要辛苦工作很長一段時間,才能在一年內看到每個工程師的生產力提高個 1%、2% 或 3%。那在當時已經算是相當大的進步了,而且來之不易。你基本上得嘗試無數個想法,最終才能找到某個能像這樣稍微提升生產力的方法。

      而 Claude 帶來的是什么呢?現在許多公司,包括 Anthropic 自身以及我們最大的客戶,都在報告高達百分之幾百的生產力提升。我記得我們最近公布的一個數據是:自從引入 Claude Code 以來,Anthropic 每個工程師編寫的代碼量增長了大約 250%。而且這是在保持代碼質量、可靠性等指標不下降的前提下實現的。在沒有犧牲這些質量指標的情況下,代碼的產出量實現了暴增。

      所以,這種級別的生產力沖擊,我認為是前所未見的。很多公司都在試圖弄清楚:我們該如何獲得這種紅利?很多公司已經嘗到了甜頭,而另一些還在摸索。我的建議幾乎總是一致的。

      第一點,直接給所有人分配 Token,讓大家放手去實驗。我未必推薦搞“刷 Token”競賽,但我絕對建議讓大家自由探索,不要讓他們每消耗一個 Token 都得去申請批準。

      第二點,給員工提供心理安全感。因為當人們在進行創新、打造能讓自己更高效的工具時,他們實際上是在改變自己的工作流程。他們會嘗試一堆想法,有些可能會失敗,有些則會成功。所以你要給予員工這種心理安全感,讓他們覺得嘗試新事物、探索新流程是完全沒問題的。

      然后,很多公司都會發現一個現象:生產力的飛躍和創新,往往并非來自你預期的那些人。在過去,每個人都能指出來:“這些是我手下最高效的工程師。”但如今,很多突破性的改進往往來自你絕對意想不到的人。可能是在你組織某個角落里的會計,用一種工程師絕對想不到的方式實現了會計工作的自動化。可能是某個營銷人員,用你聞所未聞的方式自動化了營銷流程。也可能是個剛畢業的軟件工程師,隨手就做出了一個驚艷的東西。這在以前是根本不可能發生的。

      挑戰在于,你無法提前鎖定這些創新者,你不知道他們是誰,而且結果幾乎總是會讓你大跌眼鏡。所以你該做的就是:讓大家去實驗,給他們安全感。只有當某種應用場景真正能夠規模化時,你再去考慮如何優化它。但千萬不要過早地去優化。所以,我不知道以競爭的方式來推動(刷 Token)是否符合某些公司的文化,如果是,那挺好;如果對其他公司來說,他們更愿意通過創造安全感和空間來讓工程師自由探索(這正是我們在 Anthropic 的做法),那我覺得也非常棒。這完全取決于公司本身。

      主持人:是的。坦白說,我個人就消耗了大量的 Token。我整天都在用這些工具。我覺得 Claude Code 和 Claude Co-work 對我的業務幫助極大。我是一個“超級個體”,雖然這么說有點低估了我的團隊,因為我背后有一群人主要以兼職的形式在幫我,但那是另一個話題了。

      但我確實會好奇,當我讀到這些新聞時,大型企業在這些預算和激勵機制中占據了很大比重。(就像我節目一開始問的,這事到底可不可持續?)在某些地方,這種激勵機制已經變味了。這是最近《金融時報》的一篇報道:“亞馬遜員工使用 AI 工具處理不必要的任務,以夸大使用量得分。

      部分員工表示,同事們正利用該軟件自動執行額外且不必要的 AI 活動,以增加他們的 Token 消耗量。他們表示,此舉反映了在亞馬遜出臺‘要求超過 80% 的開發者每周必須使用 AI’的指標后,員工面臨著采用該技術的巨大壓力。”

      我跟一位亞馬遜員工核實了這件事。他們說:“沒錯,就是這么回事。”他們告訴我:“我每天都會觸發一個運行好幾個小時的自動化程序,然后每天再把它刪掉,就為了湊夠這些指標。”

      所以,你剛才說你不認為這種“刷 Token”現象是需求的主要部分。但在你那邊,有沒有看到什么數據或跡象能表明,這只是個例,而不是大多數地方的普遍現象?

      Boris Cherny:這個嘛……我確實不知道有多少公司在搞這種“刷 Token”的操作。我只是略有耳聞,說這是一種趨勢。如果你看看 Claude Code 的客戶群體,我們擁有海量的客戶。所以,絕對不存在“某一家公司撐起了整個使用量”這種情況。完全不是那樣。

      我想稍微退一步,思考一下這種變革到底是如何發生的?因為我覺得這些公司想要實現的目標——我不想替他們發言,我建議你直接去問他們——但我認為他們試圖實現的,很可能是組織變革和業務流程的重塑。你如何讓你的公司從 AI 中獲益?這通常是很模糊的。它高度依賴于公司本身,因為每家公司都有不同的業務、不同的文化、不同的組織架構和不同的行事風格。

      90 年代有一篇《哈佛商業評論》的老文章,我特別喜歡,標題我忘了,大概意思是“電腦都普及了,為什么沒人看到生產力的提升?”這在當時是個大問題,對吧?對我們現在來說,電腦能提高生產力是極其顯然的常識。但在 90 年代,這并不明顯。當時發生的情況是,個人電腦正在被廣泛采用,它們正在取代大型機,而且價格變得親民。所以普通公司和初創企業都能買得起,你不再需要花幾百萬美元去買一臺大型機了。

      但當時存在一個挑戰和悖論:公司雖然引進了電腦,卻并沒有看到生產力的提升。到底怎么回事?那篇《哈佛商業評論》的文章提出,為了真正從電腦中獲益,你必須圍繞電腦重構你整個的業務流程。電腦必須處于你運作方式的核心。如果你依然保留著紙質的文件柜,抽屜里塞滿了各種資料,依然依賴紙筆和物理流程,而電腦只是被邊緣化地擺在角落里,那你絕對無法從中獲益。但如果你扔掉文件柜,清空裝滿紙張的辦公桌抽屜,把電腦放在核心位置,并以此作為所有業務流程的運轉中樞,那你就能真正獲益。

      當時的企業因此分化成了兩派。一些公司經歷了這種相當痛苦的轉型,并從中獲得了巨大的回報;而另一些則沒有。我覺得現在的情況如出一轍。許多公司都在摸索如何從 AI 的生產力飛躍中分一杯羹,大家都在進行大量的實驗,嘗試各種不同的方法來尋找破局之道。我不認為存在唯一正確的標準答案。


      “Claude Code 已經 100% 由 Claude Code 自己編寫了”

      主持人:當我們看到像 Claude Code 和 Anthropic 這樣以如此驚人的速度狂飆猛進時,把這些問題攤開來聊一聊,聽聽你的觀點,是非常有益的。好,關于“刷 Token”的話題就聊到這。

      現在我們知道,Token 當然就是模型的輸出,比如模型輸出的單詞或詞根,以及輸入進去的單詞和詞根,對吧?而這些公司正是據此來收費的,你消耗得越多,需要的數據中心就越龐大,等等。

      隨著這些模型變得越來越強大,我這么跟你說吧,有時我會懷疑它們是否達到了應有的效率。這些龐大的模型有時為了完成一個任務,即使最終輸出的結果很好,也會消耗極多的 Token。人們就會納悶:這會不會是在變相推高 Token 的消耗量?明明可以是一個非常簡單的過程,模型卻浪費了無數個 Token,沒有以最高效的方式達成目標?

      我給你舉個例子。我一直在用 Claude Co-work 制作 PPT。它在這方面非常在行。我一直用的是 Opus 4.7 模型。有幾次我跟它說:“行了,你做完了,把它導出成 PDF 發給我吧。”結果它就像突然失控了一樣。它開始瘋狂循環,調用它能用的一切工具,但就是死活導不出那個 PDF。最后我只能不停地提醒它:“不對,你正在做這個 PPT,你知道文件在哪,直接發給我!”然后它才恍然大悟說:“非常抱歉。我剛才鉆牛角尖了,糾結于一個其實根本不影響我們的限制條件。文件在這里。”然后它才把文件發出來。

      我的意思是,你能談談這些模型的效率問題嗎?考慮到我們看到的這種爆炸式增長,大家擔心其中一部分增長是 Opus 4.7 這種模型在執行基礎任務時陷入“死循環”所帶來的,這種擔憂合理嗎?

      Boris Cherny:嗯,通常我們在考量模型時,會從幾個不同的維度來看。一個是它有多聰明(智能水平),另一個是它有多快(速度),還有一個是它有多高效(效率)。我們通常致力于讓這三者齊頭并進。但在這三者之中,我認為我們應該首要優化的是智能水平。這是最核心的。所以,即使它稍微犧牲了一點效率,但如果它變得更聰明、能幫你做更多事情,那也是極具價值的。因為效率的優化是后一步的事。我們必須先讓它變聰明,然后再讓它變高效。這是一個循序漸進的過程。

      我們一直在進行大量實驗,探索究竟該如何把這種控制權交到用戶手里,因為我們并不總是知道最合適的默認設置是什么。有時候在實際使用中,你比我們更清楚怎么選。所以我們提供的一種機制是讓你選擇模型,比如你可以選 Opus、Sonnet 或者是 Haiku。

      主持人:沒錯。

      Boris Cherny:沒錯,這代表了模型的不同體量,對吧?除此之外,我們還在測試另一種機制,叫做“投入度(Effort)”。Opus 是最大的,Sonnet 居中,Haiku 最小。而“投入度”這個詞的字面意思非常直觀,就是你希望模型在這個任務上投入多少精力。你可以自己設置。我們有一個推薦的投入度。比如,為了最大化發揮 Opus 4.7 的智能,你應該選擇“超高(extra high)”或“最高(maximum)”投入度。但如果你想節省 Token,你可以選擇“中等(medium)”或“較低(low)”投入度。這是完全掌握在你手中的控制權。

      主持人:是的,我最近在節目里聊過這個話題,當時有位聽眾留言,我原本認為這些更大的模型總會找到辦法變得更高效,比如解決導出 PDF 的問題。但那位聽眾留言說:“Alex,他們解決不了像 PDF 這種問題的。這是大語言模型(LLM)技術固有的缺陷,這也是阻礙智能體 AI(Agentic AI)實現真正有用和廣泛普及的最大障礙。”

      我想試著翻譯一下他的意思。他想表達的是,我們之前討論過預測機制,這一切都是基于概率的。它本質上是在預測下一個詞。你永遠無法從 AI 智能體那里得到兩次完全相同的答案。因此,諸如死循環這類問題,是它們工作原理中自帶的特性,是無法被修復的。你怎么看?

      Boris Cherny:不,我認為這種說法不對。當你思考……好吧,讓我們把視角稍微拉遠一點。工程師是最早的“吃螃蟹的人”,對吧?一年半前,工程師們就開始使用 Claude Code 了,那時候非技術人員還沒有真正意義上開始使用智能體。那是在 Co-work 等產品問世之前。

      回想一年半前的 Claude Code,它其實并不怎么好用。我可以用它寫一點點代碼,但如果我真的放手讓它去構建一個完整的功能或整個產品,結果肯定慘不忍睹。它也會犯同樣的毛病,比如陷入死循環,代碼質量堪憂,或者就算寫出來了也不能運行。

      但在某個節點,它突然就開始進化了。隨著模型的改進和 Claude Code 的迭代,結果變得越來越好。快進到今天,Claude Code 已經 100% 由 Claude Code 自己編寫了。Co-work 也是 100% 由 Claude Code 編寫的。在 Anthropic 的全線產品中,越來越多的功能完全是由 Claude Code 寫出來的。

      這也是我們從客戶那里聽到的反饋。昨天我在創業孵化器 Y Combinator 做了一場演講,我當時讓在場的觀眾舉手。在場的人都在用 Claude Code,我問他們:“如果你們今天 100% 的代碼都是用 Claude Code 寫的,請舉手。”大約有一半的人舉起了手。然后我問:“如果你們沒有任何代碼是用 AI 寫的,請舉手。”全場大概只有一只手舉了起來。那可是一個一百多人的房間啊。

      主持人:敬那位頭鐵的勇士。

      Boris Cherny:顯然,這種純手工編碼依然有其生存空間。而其他所有人則介于兩者之間。他們的大部分代碼是用 Claude Code 寫的,但不是全部。這就是該模型如今所達到的高度。一年前它還遠達不到這個水平,一年前它還不足以勝任這些工作。

      所以,這正是你現在在 Co-work 上看到的演進過程。它還處于早期階段,我們幾個月前才剛剛發布。隨著產品打磨和模型升級,它會不斷變得更強。但這只是萬里長征的第一步。我認為,今天每一個使用 Co-work 的人,甚至每一個使用 AI 的人,都依然是早期采用者。世界上有那么多人,絕大多數人還沒有真正意義上體驗過 AI。所以,我們還有極其廣闊的提升空間。

      主持人:是的,6 月 18 日我們要在舊金山舉辦一場活動,里面很多營銷物料我都是用 Co-work 趕出來的。當然,我會來回調整。我不會讓它一次成型,我會仔細審查它的文案。但我會做一些操作,比如上傳我們播客的下載數據來展示節目的增長勢頭,然后把演講嘉賓的名字給它。它在處理這些時簡直神了:“正在生成招商書。這是活動內容。這是受眾畫像。這是演講嘉賓。這是你必須參加的理由。這是聯系方式。”簡直瘋狂,寫得太好了。

      Boris Cherny:當你第一次使用它,第一次親眼看著智能體操控你的工具時,你是什么感覺?

      主持人:怎么說呢,顯然我已經把所有權限都給它開了。我覺得很多人都有過類似的體驗:比如有一個 Claude 的瀏覽器插件,你意識到只有讓 Claude 接管你的瀏覽器并替你操作,你才能獲得最大(或者說絕大部分)的便利。那種體驗,幾乎跟我第一次坐 Waymo(無人駕駛汽車)時一模一樣。在前幾個轉彎時,我緊張得指關節發白,死死盯著,心里盤算著“我該同意它的操作嗎?”,仔細閱讀屏幕上的每一個字。然后你開始慢慢信任它,你就不停地點“同意、同意、同意”,對吧?坐 Waymo 也是一樣,你心想:“好吧,看來這玩意兒不會要了我的命。”五分鐘后,AI 在替你開車,而你已經在低頭玩手機了。這就是我使用 Code 和 Co-work 的真實體驗。這符合你們的觀察嗎?

      Boris Cherny:確實,這也是我自己的體驗。我覺得它就像任何一項新技術一樣。我最近觀察了一位朋友學習使用 Co-work 的過程,她不是工程師。前幾天她遇到個問題,筆記本電腦上的語言輸入法切換出了點故障,她怎么也搞不定。如果放在以前,她肯定會去求助谷歌:“嘿,我的電腦出了個問題,怎么修?”但這次她直接問了 Co-work。Co-work 回復說:“好的,我來看看。我能使用你的電腦嗎?”她說可以,于是 Co-work 接管了電腦。屏幕泛起一陣橙色的光暈,你可以眼睜睜地看著 Co-work 打開設置,檢查語言選擇器到底出了什么毛病,進行診斷,然后把它修好。你依然坐在駕駛位上,你能看到這一切的發生,你可以監控它。它不是在后臺偷偷摸摸進行的。

      但這真的太神奇了。換作是我,我的第一反應依然是打開谷歌。所以很有趣,對她來說,她已經習慣向 Co-work 求助了。這其實是我經常有的一種感觸。我覺得,對于那些伴隨著這些產品一路成長、見證了早期版本的人來說,他們的想象力可能不夠大膽。但對于那些第一次接觸這些產品的新手,我經常看到他們把 Claude Code 和 Co-work 用在一些我連做夢都想不到的地方。這簡直太驚艷了,充滿了創造力。我每次看到都能學到很多。


      “大多數晚上,我會同時運行數百個 Claude”

      主持人:是的。但如果要說現在的最大痛點,我認為(我也看到你在 X 上回復過別人這個問題)那就是速率限制(Rate limits)。當我看到有人說:“我試過 Claude Code 了,但我大概不會再用了。”通常是因為他們耗盡了 Token 額度,這東西只能讓他們爽一個小時。然后他們必須苦等四個小時才能再次使用,于是他們就開始尋找替代品。

      你認為速率限制對你們產品的增長造成了怎樣的阻礙?如果你們有計劃的話,打算如何解決這個問題,讓人們不再受制于這些限制?

      Boris Cherny:這個……這正是我們正在積極解決的問題。事實情況是,真正觸及速率限制的人其實只占極小一部分,這挺讓人驚訝的。Pro 用戶的觸頂比例稍微高一點,但 Max 用戶的觸頂率其實非常低。我覺得你提到的大家抱怨的情況,主要是由于兩件事。一是我們確實曾短暫下調過峰值速率限制,但現在已經回調了,而且我們實際上把速率限制翻了一倍,所以我們現在給了用戶更多的額度。但確實有那么一小段時間,我們降低了額度,所以人們撞上了這堵墻。

      第二個原因是,Claude Code 的擴展性其實非常強。所以人們可以使用各種插件和集成工具。但其中一些工具在消耗 Token 時效率極低。所以我們一直在努力做的一件事,就是把這些消耗情況透明地展示給你。這樣用戶就可以自己決定,到底要不要用這個插件?你可以清楚地看到你的 Token 有多大比例是被它吃掉的。

      我認為第三個原因是,越來越多的人正在進化為“超級用戶”。剛發布 Claude Code 時,大家一次只運行一個 Claude。而現在,在我的電腦上,我可能同時運行五個。而且大多數晚上,我會同時運行數百個 Claude,全部并行工作。是的,幾百個,有時候甚至是幾千個。這在一年半前是我根本無法想象的。顯然,這會消耗海量的 Token。很多人正在探索出這種極其消耗 Token 的新工作流。這基本已經摸到了 Max 計劃的極限了。這也是為什么你也可以直接通過 API 計費來使用。如果你就是需要無限量的 Token,你完全可以走 API。很多企業就是這么干的。

      主持人:就在不久前,我非常確定,Anthropic 的 CEO 達里奧在暗指 OpenAI 時,談到了數據中心建設的開銷,他后來也公開談論過這個。他說:“我在數據中心的開銷上努力保持克制(雖然依然在斥資數十億美元建設數據中心以支持你說的這些功能),但其他人(我們認為他指的是 OpenAI)卻在 ‘YOLO’(You Only Live Once,意為不顧一切地砸錢狂奔)。”

      但現在,OpenAI 也推出了 Codex,你也可以說他們在 YOLO,但他們確實建立起了龐大的數據中心產能。你怎么看這個問題?因為當用戶真的撞上速率限制這堵墻時,他們可能轉頭就去用 Codex 了。競爭可是非常慘烈的。

      所以你是怎么想的?Anthropic 內部又是怎么看待這個問題的?畢竟從外界看來,你們在數據中心建設上的這種“克制”,可能會導致你們在這場最重要的產品爭奪戰中流失用戶。

      Boris Cherny:嗯。首先,我們的增長速度達到了前所未有的巔峰。Claude Code 的增長正在不斷加速。而且我認為,正因為絕大多數人其實很少會觸及速率限制,所以這并沒有構成一個巨大的危機。對于那些真正受到限制的用戶,我們正全神貫注地改善他們的體驗。所以我們將 500 的速率限制翻了一倍。我們今天還要宣布,我們將提高每周的速率限制。當然,我們還宣布啟用了由馬斯克提供的全新 Colossus 超級計算機產能,正是為了服務這些海量涌入的新用戶。

      主持人:借馬斯克之手。

      Boris Cherny:借埃隆之手,是的。因為這種增長簡直……根本沒人能預測到。這遠遠超出了我們最瘋狂的預測。所以對我們來說,最重要的是我們必須服務好我們的用戶。我們要確保用戶獲得極致的體驗。我們正在傾盡全力來實現這一目標。

      主持人:Codex 的出現讓你感到驚訝嗎?你如何看待這個競爭對手?

      Boris Cherny:我覺得市場上永遠不缺模仿者,永遠不缺競爭對手。對我來說,這是一種變相的贊美,它只會逼著所有人做得更好。所以,我最關心的,就是盡我們所能,把服務用戶這件事做到極致。我們鼓勵團隊里的每一個人每天都去和用戶交流,每天都把產品打磨得更好一點點。這才是我的心之所屬。

      我們剛才稍微提到了這一點,但我認為我們應該重點強調一下,這項技術的影響力將遠遠超越聊天機器人。我們聊了訂機票,我聊了做營銷 PPT。而就在我們錄制節目的這周,你們又推出了一個小企業場景的新應用,Claude Co-work 現在可以接管 QuickBooks 并替你做賬了。這最終會走向何方?我是說,你認為大方向的路線圖,最終會把你們引向哪里?

      Boris Cherny:對于 Claude Code 和 Co-work,我們目前在構思幾個大方向。第一個主題是提升智能水平。我認為這幾乎完全取決于模型本身。隨著模型的進化,我們可以承擔越來越宏大的任務。在編程領域,過去是一次寫一行代碼,現在是構建完整的功能甚至整個產品。對于 Co-work 來說,它剛起步不久,最初只能幫你寫個文檔,現在已經能訂機票、串聯多種工具、甚至幫你做 QuickBooks 賬目了。這個前沿邊界正在以極快的速度不斷推進。

      我們也在思考如何讓 Claude Code 執行更長時間的任務。我們最近上線了一個叫“自動模式(Auto mode)”的功能。自動模式本質上是為了取代那些煩人的“權限確認彈窗”。以前,每當模型想使用一個工具時,Claude 都會問你:“我可以使用這個工具嗎?”通常你都會點“是”,點多了你就會對這種機械的確認感到厭煩。

      主持人:“始終允許”。大家最后都會去點那個按鈕。

      Boris Cherny:沒錯,沒錯。但從安全角度來看,你在授權時保持深思熟慮其實極其重要。我們意識到,由于我們給用戶彈出了太多這樣的對話框,他們不僅沒有深思熟慮,反而產生了“彈窗疲勞”,于是他們就開始無腦點“是”或“始終允許”。而“自動模式”就是我們的解法。這是一種全新的工具調用路由方式。

      它的運作原理是:每當 Claude 想使用一個工具時,它會去問另一個 Claude:“使用這個工具安全嗎?”正在干活的那個 Claude 只掌握了部分上下文,并不了解全貌。此外,我們還設置了多層安全護欄。我們花了幾個月的時間反復打磨,以確保它的絕對安全。我們使用了數千種不同的基準測試和評估手段來驗證其安全性。最終我們發現,無論是在實驗室環境中,還是現在在真實世界里,這種模式都比我們以前的做法更安全。

      所以,對用戶來說,這是一個極大的福音,因為你再也不用傻坐在那里一遍遍地點“是”了。而且實際上,結果也更安全了。因為如果在一長串 Claude 請求你執行的指令中,暗藏著一個危險指令,你可能一不留神就點“是”放行了。但如果你使用自動模式去問第二個 Claude,它是絕對不會放行的。所以,這是一個重大的投入方向。

      第三大的方向,大概就是并行運行更多的 Claude。關于 Claude,有一件非常酷的事(這也是我們在 Claude Code 早期用戶身上就開始觀察到的現象),那就是現在很少有人一次只運行一個 Claude Code 了。大多數人都會同時跑好幾個,少則幾個,多則成千上萬個。在 Co-work 上,我們也開始看到同樣的趨勢。當你越來越放心地讓 Co-work 自主運行時,你會啟動一個任務,然后再啟動第二個任務,然后你去忙別的,你只是在并行處理更多的事情。我認為,在這個領域有巨大的空間去優化體驗,讓這種多線程操作對用戶來說變得更加直觀。比如,你該如何操作?什么時候該這么做?對吧?

      主持人:這大概也會延伸到我們使用聊天機器人的方式上,對吧?有趣的是,Anthropic 過去跟聊天機器人的關系一直挺微妙的。一開始是技術優先,然后決定做個聊天機器人,發布了 Claude,接著就把重心轉向了企業級服務。你看以前的那些數據圖表,Claude 總是墊底的。

      但現在,你看到 Claude 的使用量正在飆升。我有一個想法,想聽聽你的意見:聊天機器人的未來,不再是“我問你答”的模式,而是我向你提出一個問題或傾訴一個煩惱,然后聊天機器人會主動建議它可以替我采取什么行動。比如現在我一直在念叨去印度的旅行,我猜未來我得到的反饋會像你剛才說的那樣,不再需要我去自己操作訂票這個中間步驟,一個更主動的聊天機器人會直接說:“好的,交給我來處理吧。”大方向是這樣嗎?我的思路對嗎?

      Boris Cherny:我能預見那樣的未來。確實會是這樣。

      主持人:你們正在研發這個嗎?

      Boris Cherny:智能體就是未來,我們正在嘗試各種不同的實驗。我們確實在做一些類似方向的探索。是的。


      “我不寫代碼了,我只負責給 Claude 寫提示詞”

      主持人:好的。但這些工具的能力終歸是有極限的,對吧?人們在談論“同時并行成千上萬個 Claude”的局限性時,有一個很幽默的角度,那就是看看 Anthropic 正在招什么人。

      我在 Anthropic 官網上最喜歡的一條招聘啟事是:你們在招 Salesforce 管理員。你們還在招募顧問,去幫助企業部署這項技術。很多人將此視為一種心照不宣的承認:這玩意兒的能力也就到這兒了。沃頓商學院的教授伊森·莫利克(Ethan Mollick)是這么說的:“當這些 AI 實驗室解散了他們新成立的咨詢團隊時,你就會知道他們是真的相信 ‘超級人工智能(ASI)’ 要來了。只要還需要人類去弄清楚 AI 有什么用,還需要人類去搞組織變革和系統集成,那人類的飯碗看起來就還挺穩的。”你怎么看?

      Boris Cherny:嗯。如果你看看我目前在做的工程工作,我不寫代碼了。我只負責給 Claude 寫提示詞。其實,我現在主要做的是,用一個 Claude 去向其他 Claude 下達指令。所以我甚至都不直接和 Claude 對話了,我有個專屬的 Claude 在替我和我的 Claude 們溝通。在工程領域,你已經看到一個個體的杠桿率(Leverage)正在發生爆炸式的增長。關鍵在于一個人能建立多大的業務?一個工程師能支撐多少個產品?在 Anthropic,現在一個工程師所擁有的杠桿率簡直令人咋舌。

      我認為我們開始在其他領域也看到了同樣的現象。我們看到營銷人員正在用 Claude 做事;我們也看到前線部署工程師正在用 Claude Code 來構建實施方案;我們還看到了我們的銷售團隊——在 Anthropic,大概一半的商業化團隊在用 Claude Code,另一半在用 Co-work。我覺得每個人都在用這些產品。

      所以我們看到的是,盡管個人的杠桿率在飆升,但我們的瓶頸依然是招不到足夠多的優秀人才。因為需求實在太瘋狂了,有太多太多的東西需要去構建。所以,即便每個人能產出百倍的效能,人才依然是我們最大的瓶頸。

      主持人:但我想說,如果有人反駁說,既然這東西這么強大,你大可以對它說:“去看看我的銷售團隊是怎么運作的,然后用一個提示詞把 Salesforce 給我配置好。”人們常舉的另一個例子是:“如果 Anthropic 敢讓 AI 去處理 IPO 的文書工作,而不是去雇一家投資銀行,那我就相信 Anthropic 真的擁有非常強大的 AI。”這些測試標準對你們來說公平嗎?

      Boris Cherny:呃,我們確實開始看到一些苗頭……我們團隊里有個人一直在用 Claude 報稅。我未必推薦大家這么干,但我承認,我也把我的稅務數據扔給 Claude 算過,然后跟我會計師算出來的結果對比了一下,兩者非常接近。

      主持人:是的,我也干過這事。各位聽眾,這不是鼓勵你們這么做,但這確實是個很有趣的應用場景。

      Boris Cherny:沒錯。但我認為人們在討論這個問題時,從根本上忽略了一點:最終,總得有一個人去跟 Claude 溝通,要求 Claude 去做這件事。所以,即使 Salesforce 是自動配置好的,即使不是一個人在手忙腳亂地點各種按鈕,而是 Claude 在干活,也必須得有人去給 Claude 下達這個指令。如果你需要把 Salesforce 配置成各種復雜的模式,那么“要求 Claude 去做這件事”本身,可能就會變成一份全職工作。當然,在某個時刻,Claude 會變得非常擅長“要求 Claude 去做這件事”。而那個人將變成“要求那個去要求 Claude 做事的 Claude”的人。這條指令鏈會變得越來越深。但歸根結底,你依然需要人類來掌舵。

      主持人:但也許在未來,他們的工作就只剩下問一個問題了。

      Boris Cherny:是的。但想象一下,能夠問出那個正確的問題,這背后蘊含著多么恐怖的杠桿率。

      主持人:確實如此。說到點子上了。既然我們聊到了 Salesforce,那我們就不得不聊聊所謂的“SaaS 末日(SaaS apocalypse)”了。隨著自動化編程越來越普及,對于哪些軟件公司能安然無恙,哪些可能會陷入危機,你有一些非常有趣的觀點。你之前談論過存在的各種不同的“護城河”,以及哪些護城河更重要,哪些變得不那么重要了。趁著我們在聊這個,你能簡單分享一下嗎?

      Boris Cherny:商業領域有一個非常好的分析護城河的框架,叫做“七種力量(Seven Powers)”。這種框架有很多,但這是我最喜歡的一個。我大學其實是學經濟學的,沒學計算機科學。所以我現在的思維方式,依然是習慣用這些框架來思考問題。

      商業中有很多種不同的護城河。有些公司只有一條,有些公司則有多條,就像擁有一個護城河投資組合。比如“規模經濟”:隨著生產規模的擴大,規模報酬會遞增。另一個是“網絡效應”:比如像通訊應用,用的人越多,它對每個人的價值就越大。還有“轉換成本”,還有“流程優勢”等等。

      我認為大多數護城河依然會發揮作用,但在未來一年里,它們的相對重要性會發生變化,有些會升值,有些會貶值。我認為會升值的一個護城河是“網絡效應”。因為無論代碼是誰寫的,無論你產品的核心是一個智能體還是別的什么,也無論你的產品里有沒有 AI 智能,只要你的產品具備網絡效應,它就依然堅不可摧。

      而有些護城河則會變得不那么重要。例如“轉換成本”。因為如果你想把供應商從 A 換到 B,你只需讓 Claude 幫你搞定就行了。而且隨著時間的推移,Claude 在這方面會越來越得心應手。所以作為一家公司,你應該思考的是:你的護城河到底是什么?我認為那些最頂級的巨頭公司,通常都擁有多條護城河。這絕不是靠單一優勢撐起來的。你之所以能達到那種規模,能建立起一個長期堅不可摧的商業帝國,靠的是不斷積累這些護城河。你需要很多條。但總之,我會去思考在這里面,什么會變得更有價值,什么會貶值。

      主持人:但我覺得,當你審視這些五花八門的軟件公司時,如果你正在使用像 Claude Code 這樣的工具,是不是幾乎所有的護城河都會消融殆盡?因為你完全可以只待在這一個應用里,由它去對接所有的軟件,這意味著到最后,其實只剩下了一家軟件公司?

      Boris Cherny:嗯。我的意思是,未來的演變路徑有很多種。你說的這種情況是有可能的,但我感覺有點遙遠。因為,打個比方,假設我在用一款聊天軟件,我怎么決定用哪款?肯定是我的朋友們在哪款上,我能聯系到誰,我就用哪款。所以,即便我能為自己量身定制一款極其完美的聊天應用(這在今天我已經能做到了,我用 Claude Code 幾個小時就能寫出一個超棒的聊天應用),它依然毫無用處,因為我沒法用它跟我的朋友聊天。

      主持人:但這正是我想舉的例子。完全正確。你可以核實一下我說的對不對:你的聊天應用里會有一個智能體,當你的朋友給你發消息時,它會通知你。我知道你經常在 iPhone 上用 Claude Code,對吧?所以你只會看到通知,然后你直接回復就行了。只要那些公司愿意開放接口,你所有的通訊都有可能集中在這些智能體里。

      Boris Cherny:是的。我的意思是,最終呈現給你的可能確實是一個智能體,但底層的通訊是如何發生的呢?比如你看看像 Signal 這樣的通訊應用,它使用的是特定的通訊協議。我可以自己建一個應用,也許能使用同樣的協議,但我認為它實際上是無法向 Signal 上的其他用戶發送消息的。不過你說得對,我可以讓一個智能體,通過調用現有的、支持這種操作的應用,來替我完成消息發送。是的。所以,未來到底會如何演變,目前還不得而知。我認為在當下,人們是混合使用各種 App 和智能體的。

      但我從根本上相信,隨著時間的推移,許多護城河的價值實際上還會不斷攀升。你可以想另一個例子,比如臺積電(TSMC)或者某種芯片制造商。你看看他們在打造制造工藝上投入了多少心血,在打造那種“成本隨規模下降”的工藝上傾注了多少努力,這是一種底層的經濟學法則。有很多公司,特別是在制造業,都在做這種“規模越大成本越低”的事情。

      對于科技公司來說,基礎設施就是如此。如果你構建了極其強大的基礎設施,你就能支撐更多的用戶,而每個用戶的邊際成本會隨著時間的推移不斷下降。如果你擁有這種效應,那么你我能不能自己寫 App 就根本不重要了。那依然是一條極其強大的護城河。但我當然也認為,這兩種力量目前都在發揮作用。


      “如果楊立昆愿意坐下來跟我一起用 CC 寫一個小時代碼”

      主持人:好的,還有 10 分鐘,我還有三個問題。看看我們能不能都過一遍。Anthropic 的創始人之一杰克·克拉克(Jack Clark)最近好像說過,他認為到 2028 年,這些模型有 60% 的概率會開始自我進化。概率或年份可能會有一點偏差,但大致是這個意思。你現在就身處這個代碼自動生成的應用中,你也在掌管這個應用。你同意杰克的看法嗎?

      Boris Cherny:聽起來挺靠譜的。是的。看看 Claude Code 現在的編寫方式,100% 的 Claude Code 都是用 Claude Code 寫的。自從去年 11 月,也就是 Opus 4.5 發布以來,就一直是這樣了。

      主持人:那聽起來就像是一個“極速起飛(Fast takeoff)”的場景啊。你預見到了嗎?

      Boris Cherny:我覺得,這是有可能的。而這正是 Anthropic 存在的意義。如果你去問任何一位工程師或研究員,他們為什么加入 Anthropic,他們都會告訴你:為了 AI 的安全。因為對我們來說,當我們展望未來的幾年時,最重要、也是我們最想為我們的子孫后代把控好的一件事,就是我們要確保這東西是安全的,我們要確保一切向善發展。因為,是的,極速起飛確實是可能的結果之一。

      我認為我們目前看到的還不是那種情況。現在 Claude Code 確實在編寫自己,但下達提示詞的依然是人類。Claude 開始為 Claude Code 下一步該開發什么生成自己的想法,但這些想法并不總是好的,而且目前大部分的創意依然是我提出來的。但在某個節點,這一切將會改變。模型會不斷進化,它將變成一個更強大的自我強化循環。

      主持人:好的。我特別想聽聽你對“世界模型(World model)”之爭的看法。

      支持世界模型的人認為,大語言模型對后果毫無概念,你必須把世界模型內置進去,才能打造出真正有效的智能體。楊立昆(Yann LeCun)就曾說過:“如果沒有世界模型,你就不可能構建出可靠的智能體系統。LLM 沒有世界模型。它們無法在采取行動之前預測行動的后果。”

      按照楊立昆的說法,它們只是盲目行動,至于接下來會發生什么,那就是別人的麻煩了。我最近和 OpenAI 的格雷格·布羅克曼(Greg Brockman)聊過,他基本上完全不接受這種說法,他認為 LLM(直接通過這些文本模型)就是通向通用人工智能(AGI)的正確道路。你站哪邊?你是一個堅信必須內置世界模型智能的人,還是認為單靠 LLM 就足夠了?

      Boris Cherny:如果楊立昆愿意坐下來跟我一起用 Claude Code 寫一個小時的代碼,我非常樂意向他發出邀請。我很樂意展示給他看。

      主持人:那你們真該在我的節目上切磋一下。

      Boris Cherny:好啊。然后我很想聽聽他的真實想法。也許他會改變主意,也許不會。

      主持人:行。但你自己的觀點呢?

      Boris Cherny:你知道的,我是個堅定的產品派。所以我在這方面其實沒什么強烈的學術立場。

      主持人:好吧,如果你不介意的話,讓我再稍微深挖一點。你是做產品的,但我聽不止一個人提出過這個觀點:如果沒有對世界運轉方式的認知(就像世界模型那樣),LLM 就無法理解這個世界的規律和行為的后果。你用 Co-work 訂了多少趟航班?八趟航班和幾家酒店。你心里肯定認為它對“后果”是有認知的,否則你絕不會把你的信用卡交給它(我猜你肯定交了)。所以,針對這個具體的論點,你怎么看?

      Boris Cherny:我覺得,從我閱讀到的 Anthropic 研究人員的論文來看,這些模型的智能程度是令人震驚的。因為就像你一開始說的,它們在最底層做的事情僅僅是預測下一個 Token。所以你會覺得這聽起來挺蠢的,這怎么可能孕育出智能呢?但我們實際上發表了大量關于模型如何能夠進行規劃、如何能夠真正進行推理的研究。模型展現出了所有這些極其令人驚訝的行為,而這些行為是你絕對無法從一個僅僅“預測下一個詞”的模型身上預見到的。所以,我不會低估它的潛力。

      主持人:我覺得我最喜歡的一個例子是它們寫詩的時候。當它們在寫第一行時,你就能在模型中觀察到(這是 Anthropic 的研究)——它們已經在構思下一行了。

      Boris Cherny:沒錯。

      主持人:這簡直讓人匪夷所思,這怎么可能呢?

      Boris Cherny:沒錯。我的意思是,我就是這么理解的。如果換作是我在寫詩,我也會這么構思。這太瘋狂了。你教這個東西去預測下一個詞,但不知何故,如果下一個詞的難度足夠高,它就必須學會如何深謀遠慮,它就必須學會掌握所有這些能力。

      主持人:好的,最后一個問題。在我報道科技行業的職業生涯中,每當我看到重大的技術變革正在醞釀時,我有時會產生懷疑。有些變革成功了,有些則淪為了泡沫。我總要問自己:我們怎么確信這就是未來,而不是一場狂熱的白日夢?數據表明這是真實的。

      但我也在想,你必須對“這種趨勢在未來將如何繼續演進”的推斷保持一絲警惕。認為這是一場“白日夢”的論點是:也許人們只是想要極其簡單的界面,他們不介意多點幾下屏幕;而在 Claude Code 里敲指令感覺太極客了,它可能很難像吸引開發者那樣,去吸引普通的日常用戶。你會如何回應這種質疑?

      Boris Cherny:我們最近為 Opus 4.7 舉辦了一場黑客松,其中一位獲勝者是個醫生,他做了一個 App。參賽的還有電工、木匠,其中很多人根本沒有編程經驗,但他們用 Claude Code 做出了非常有用的東西。在我們的另一場黑客松中,甚至有人做出了一個初創項目并成功把它賣掉了。

      毫無疑問,當我們最初打造 Claude Code 時,它是為工程師量身定制的,而工程師們也很快摸索出了怎么用它。但很快,非技術人員也弄明白了如何用它來創造經濟價值。實際上,如果你看看今天的使用情況,很多人根本不是工程師,而且這東西對他們來說太有用了,以至于他們不惜克服重重困難去使用它。甚至在 Co-work 推出之前,人們就為了在終端(Terminal)里安裝 Claude Code 而煞費苦心。對很多人來說,那是他們人生中第一次使用終端。

      當然,現在的 Claude Code 已經有了桌面端應用、iOS 應用,還有 Slack 小程序。我們提供了很多交互方式。但當初,人們為了用它可是費盡了周折,就因為它的價值太大了。所以對我這個做產品的人來說,這就是檢驗一個東西是否有用的終極市場測試:是不是有很多人每天都在用它,并且持續每天都在用?答案是肯定的,有海量的人在用,而且這個數字還在不斷增長。我總是被人們使用它的各種奇思妙想所驚艷。

      主持人:是的,我得承認,連我自己都被我使用這些工具的方式給驚艷到了。我不知道,我們拭目待待接下來會發生什么。我非常期待繼續使用它,也非常高興能有機會和你交流。希望我們以后還能再聊。

      Boris Cherny:好的,感謝你的邀請。

      免費領取 100 小時 AI 算力|AI科技大本營讀者專屬福利

      加入 AI 開發者計劃獲取:

      ? AI 算力資源

      ? 官方技術社群

      ? Workshop 與 AI Academy

      ? 開發者專屬福利

      立即掃碼,前 50 名領取瑞幸咖啡(領取地址:https://s.csdn.cn/4nPsOp)


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      38.99萬,瘋狂啊

      38.99萬,瘋狂啊

      放毒
      2026-05-22 14:49:05
      藍營集體跳船,鄭麗文想不到,大戲沒上演,等來了蔣萬安6字絕殺

      藍營集體跳船,鄭麗文想不到,大戲沒上演,等來了蔣萬安6字絕殺

      小陸搞笑日常
      2026-05-22 13:25:11
      默克爾為何選擇此刻破戒?任何輕視特朗普的必將付出代價

      默克爾為何選擇此刻破戒?任何輕視特朗普的必將付出代價

      民間胡扯老哥
      2026-05-22 06:44:40
      男子網購719元女士睡衣當520禮物送女友,收貨后用男士睡衣調包退貨退款;浙江商家連夜開車4小時赴合肥報警,涉事男子被行拘9日

      男子網購719元女士睡衣當520禮物送女友,收貨后用男士睡衣調包退貨退款;浙江商家連夜開車4小時赴合肥報警,涉事男子被行拘9日

      揚子晚報
      2026-05-22 07:20:46
      當年的庫里接班人,普爾現狀如何?2次被交易,場均13分成邊緣人

      當年的庫里接班人,普爾現狀如何?2次被交易,場均13分成邊緣人

      大西體育
      2026-05-21 15:11:32
      特朗普又要變臉?中方叫停訪問,鄭麗文看懂了,美國表態還不夠

      特朗普又要變臉?中方叫停訪問,鄭麗文看懂了,美國表態還不夠

      李健政觀察
      2026-05-21 17:46:58
      聯想發出史上最強財報:股價應聲暴漲18.63%!創下逾26年新高

      聯想發出史上最強財報:股價應聲暴漲18.63%!創下逾26年新高

      快科技
      2026-05-22 15:20:09
      100萬真的是一筆巨款。

      100萬真的是一筆巨款。

      老陸不老
      2026-05-21 09:29:17
      以色列建國78周年,邀請中方參會,兩國代表已握手,內塔態度變了

      以色列建國78周年,邀請中方參會,兩國代表已握手,內塔態度變了

      黑鷹觀軍事
      2026-05-22 17:13:29
      6人擅自進入廢棄金礦盜采3人身亡,江西上饒公布事故調查報告

      6人擅自進入廢棄金礦盜采3人身亡,江西上饒公布事故調查報告

      上觀新聞
      2026-05-22 10:21:26
      江西繼子被后媽冷待10年,考上清華辦升學宴,他拿出鑒定后媽呆住

      江西繼子被后媽冷待10年,考上清華辦升學宴,他拿出鑒定后媽呆住

      張道陵秘話
      2025-05-15 19:50:15
      蘋果砍了12年的功能回來了!一根線救活萬元老機器

      蘋果砍了12年的功能回來了!一根線救活萬元老機器

      快科技
      2026-05-20 12:06:18
      與鄭麗文同臺僅幾分鐘,李四川解釋原因:要趕下一個行程

      與鄭麗文同臺僅幾分鐘,李四川解釋原因:要趕下一個行程

      海峽導報社
      2026-05-21 17:24:03
      吳彥祖為拍《九龍城寨》剃頭:光頭小胡子兇悍難敵!

      吳彥祖為拍《九龍城寨》剃頭:光頭小胡子兇悍難敵!

      東方不敗然多多
      2026-05-21 18:06:14
      3個孩子的媽媽獲選神舟二十三號航天員,首飛就要離家一整年!

      3個孩子的媽媽獲選神舟二十三號航天員,首飛就要離家一整年!

      史智文道
      2026-05-22 11:30:57
      棄劇了!發現《主角》越來越不對勁了,原來易青娥是一個這樣的人

      棄劇了!發現《主角》越來越不對勁了,原來易青娥是一個這樣的人

      鄉野小珥
      2026-05-22 14:57:37
      孩子自卑時,鼓勵是虛、比較是害、安慰是廢,真正聰明的父母只做這兩件事

      孩子自卑時,鼓勵是虛、比較是害、安慰是廢,真正聰明的父母只做這兩件事

      心理觀察局
      2026-05-16 10:13:45
      一幼兒園辦畢業典禮賣門票,每組家庭1大1小150元,家長覺得太憋屈,當地教育局:將調查核實

      一幼兒園辦畢業典禮賣門票,每組家庭1大1小150元,家長覺得太憋屈,當地教育局:將調查核實

      縱覽新聞
      2026-05-22 17:22:21
      四百名醫生提醒:晨起喝溫水對心腦血管的影響,建議抽空看看

      四百名醫生提醒:晨起喝溫水對心腦血管的影響,建議抽空看看

      鬼菜生活
      2026-05-21 06:46:40
      175死,特朗普突然出手,美軍發起斬首行動,英法德俄失聲

      175死,特朗普突然出手,美軍發起斬首行動,英法德俄失聲

      浪子阿邴聊體育
      2026-05-21 09:24:20
      2026-05-22 18:43:00
      AI科技大本營 incentive-icons
      AI科技大本營
      連接AI技術的創造者和使用者
      2700文章數 7687關注度
      往期回顧 全部

      科技要聞

      雷軍:輸給特斯拉不丟人

      頭條要聞

      80后地產女王自殺倒在樓市黎明前 曾稱或面臨刑事責任

      頭條要聞

      80后地產女王自殺倒在樓市黎明前 曾稱或面臨刑事責任

      體育要聞

      最糟糕裁判?他想要退役當市長

      娛樂要聞

      周也戀情曝光!對象身份不簡單

      財經要聞

      證監會擬對老虎、富途、長橋依法嚴厲處罰

      汽車要聞

      舒適智能配置滿 昊鉑S600開著沒那么運動也挺好

      態度原創

      時尚
      數碼
      健康
      公開課
      軍事航空

      沒想到今年最火的發型是它,從18歲到80歲都適合

      數碼要聞

      吉尼斯認證“最清晰通話”!安克發布兩款降噪耳機:搭載自主研芯片、1399元起

      外泌體與干細胞竟是“快遞”與“工廠”的關系?

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      俄羅斯試射具備核打擊能力的高超音速導彈

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 岛国av免费在线观看| 日韩经典午夜福利发布| 影音先锋在线资源网站| 深夜视频国产在线观看| canopen草棚类别9791怎么查| 天码毛片一区二区三区入口 | 欧美日韩在线看| 传媒剧在线mv免费在线观看| 深夜av在线免费观看| 影音先锋中文字幕第一页| 97色欧美视频在线观看| AV黄色| 成人动漫在线观看| 亚洲AV无码久久精品色欲| 五月开心亚洲综合在线| 福利一区二区在线播放| 密臀AV| 欧美亚洲中文| 一级高清毛片免费a级高清毛片| 欧美亚洲综合久久偷偷人人| 亚洲人午夜精品射精日韩| 亚洲国产欧美久久香综合| 亚洲三级香港三级久久| jizz国产| 狠狠色婷婷久久综合频道毛片| 国产日韩入口一区二区| 四虎福利视频| 中文字幕麻豆一区二区| 精品一区二区不卡无码AV| 狠狠干老司机| 日韩人妻少妇中文字幕av| 又大又粗又硬又爽黄毛少妇| 老太脱裤子让老头玩xxxxx| 不卡的av在线| 熟女白浆一区二区| 美女一级毛片无遮挡内谢| 成人免费A级毛片无码片2022| 亚洲国产制服丝袜| 黄色综合网| 成人淫网| 麻豆亚州无矿码专区视频|