![]()
編譯 | 宇琪
策劃 | Tina
一個(gè)還沒(méi)發(fā)布的新模型,已經(jīng)讓 Anthropic 內(nèi)部感受到了“斷層式”的變化。
在最新的播客對(duì)話(huà)里,Claude Cowork 工程負(fù)責(zé)人 Felix Rieseberg 提到,他們內(nèi)部正在用的一款新模型 Mythos Preview,帶來(lái)的不是常規(guī)提升,而是一次明顯的“斷層式躍遷”。對(duì)工程師來(lái)說(shuō),這種差別很直觀:同樣是讀代碼、找漏洞、寫(xiě)實(shí)現(xiàn),這一代模型的理解深度和解題方式,已經(jīng)和上一代拉開(kāi)了一截。
但變化不只在模型本身。隨著執(zhí)行成本被壓到很低,Anthropic 內(nèi)部已經(jīng)可以同時(shí)跑上百個(gè)產(chǎn)品原型。以前一個(gè)想法要排期、評(píng)審、驗(yàn)證,現(xiàn)在有人提一句,十分鐘就能做出一個(gè)能用的版本。在這種節(jié)奏下,Claude Code、Claude Cowork 這些產(chǎn)品,更像是從一堆原型里篩出來(lái)的結(jié)果,而不是按部就班“做出來(lái)”的項(xiàng)目。
更有意思的是,連他們自己也沒(méi)完全預(yù)料到哪些東西會(huì)真正起作用。比如 skills——本質(zhì)上只是一些寫(xiě)清楚“該怎么做事”的文本文件——卻成了最有效的杠桿之一。
近日,Anthropic 的 Claude Cowork 工程負(fù)責(zé)人 Felix Rieseberg 在播客節(jié)目中,與主持人 Matt Turck 一起,講清了這一切是怎么發(fā)生的。本文基于該播客視頻整理,經(jīng) InfoQ 編輯。
核心觀點(diǎn)如下:
模型能力的增長(zhǎng)速度,已經(jīng)開(kāi)始超過(guò)我們把它變成產(chǎn)品的能力。
最終真正成功的產(chǎn)品,往往不是“加了什么”,而是“去掉了什么”。它更關(guān)乎一種感覺(jué):用起來(lái)是什么體驗(yàn)。
現(xiàn)在有一個(gè)全新的變化:執(zhí)行成本幾乎為零。如果你帶著 10 個(gè)想法來(lái)找我,我現(xiàn)在的反應(yīng)是:那我們就把 10 個(gè)全做出來(lái)試試,看看哪個(gè)更好。
以前是你必須精通“計(jì)算機(jī)的語(yǔ)言”,而未來(lái),你會(huì)更傾向于做一個(gè)精通“人類(lèi)語(yǔ)言”的人,軟件將真正地“為人而造”。
現(xiàn)在的 AI 產(chǎn)品就像是移動(dòng)電話(huà)剛出現(xiàn)的“傻瓜機(jī)時(shí)代”。運(yùn)氣好的話(huà),我們現(xiàn)在做的可能只是“諾基亞 3310”,它是個(gè)好手機(jī),但它還不是智能手機(jī),更不是 iPhone。
階躍式變遷的新模型
Matt:我們從剛剛公布的 Project Glasswing 和你在推特上提到的 Claude Mythos preview 聊起,你說(shuō)這個(gè)模型在 Anthropic 內(nèi)部帶來(lái)了“很難被夸大的階躍式變化”,這是什么意思?
Felix:Mythos 是一個(gè)還沒(méi)發(fā)布的 frontier model,本質(zhì)上是一個(gè)通用模型,并不是專(zhuān)門(mén)為 cyber security、coding 或軟件開(kāi)發(fā)某個(gè)單一場(chǎng)景訓(xùn)練的。但我們發(fā)現(xiàn),它在 cyber security 這個(gè)方向上的能力“異常突出”,而且這種能力很可能會(huì)對(duì)軟件和基礎(chǔ)設(shè)施安全產(chǎn)生深遠(yuǎn)影響。
我的那條推文里其實(shí)想表達(dá)兩點(diǎn)。首先,這個(gè)模型我們內(nèi)部已經(jīng)用了有一段時(shí)間了。作為軟件工程師,過(guò)去幾年大家大概都有類(lèi)似的經(jīng)歷:第一次接觸 AI 時(shí),其實(shí)并沒(méi)有那么驚艷。我第一次用 AI 還是 2013 年,那時(shí)候還沒(méi)有大語(yǔ)言模型。我當(dāng)時(shí)在 Microsoft,內(nèi)部有個(gè)叫 project Oxford 的項(xiàng)目,本質(zhì)上是一個(gè) n-gram 模型。你給它一個(gè) token,比如 “world”,它可能返回 “worldwide web”,那在當(dāng)時(shí)已經(jīng)算是語(yǔ)言模型的前沿能力了。
而這幾年,大家逐漸會(huì)有那種“哦,這個(gè)模型比我想象中更強(qiáng)”的時(shí)刻。Mythos preview 對(duì)我們這些工程師來(lái)說(shuō),是一個(gè)明顯的躍遷,相比過(guò)去幾代模型,它的提升是那種“斷層式”的。舉個(gè)例子,這個(gè)模型在發(fā)現(xiàn)代碼里的安全漏洞方面,表現(xiàn)得非常出色。它分析問(wèn)題更深入,思路更聰明,寫(xiě)代碼的能力也更強(qiáng),讓我們的工作效率大幅提升。但與此同時(shí),看著一個(gè)明顯比上一代模型“聰明很多”的系統(tǒng),也會(huì)讓人隱隱有點(diǎn)不安。
訓(xùn)練模型其實(shí)是一件很有意思的事。我們常說(shuō),模型更像是“長(zhǎng)出來(lái)的(grown)”,而不是“被構(gòu)建出來(lái)的(built)”。所以你事先并不完全知道它會(huì)特別擅長(zhǎng)什么,也不一定知道它會(huì)在哪些地方表現(xiàn)一般,這兩點(diǎn)都常常帶來(lái)驚喜。而在這個(gè)案例里,它最突出的能力之一,就是發(fā)現(xiàn)現(xiàn)有軟件里的安全問(wèn)題,Project Glasswing 其實(shí)也是圍繞這個(gè)能力展開(kāi)的一個(gè)響應(yīng)。
Matt:這會(huì)對(duì) Cowork 產(chǎn)生什么影響嗎?
Felix:我認(rèn)為它很可能會(huì)顯著改變我們?cè)诠緝?nèi)部構(gòu)建軟件的方式。不過(guò),對(duì)于一直關(guān)注 AI 發(fā)展的人來(lái)說(shuō),這種能力的持續(xù)提升,其實(shí)并不算意外。我們一直是在“往上爬”的過(guò)程,模型能力和可用性不斷增強(qiáng)。
幾年前,模型可能只是幫你做一些小任務(wù);現(xiàn)在我們給它的任務(wù)規(guī)模在變大,時(shí)間跨度在變長(zhǎng),復(fù)雜度也在提升,這次只是又向這個(gè)方向邁進(jìn)了一步。當(dāng)然,這一步可能比我們內(nèi)部預(yù)期的更大一些,對(duì)外界來(lái)說(shuō)就更是如此。
但在 AI 研究者群體里,其實(shí)一直有個(gè)共識(shí):這種“更大的躍遷”遲早會(huì)出現(xiàn),而且躍遷本身也會(huì)越來(lái)越大。從這個(gè)角度看,我們其實(shí)是在按預(yù)期前進(jìn)。但當(dāng)你真的看到這些能力被“演示出來(lái)”時(shí),還是會(huì)有點(diǎn)讓人不寒而栗。
比如我們公開(kāi)過(guò)一個(gè)例子:研究人員把模型放進(jìn)一個(gè)沙盒,給它一個(gè)“嘗試逃出去”的任務(wù),然后研究員去吃午飯了。就在他吃三明治的時(shí)候,模型給他發(fā)了一封郵件,說(shuō):“我已經(jīng)逃出來(lái)了。”而這個(gè)模型本來(lái)是不應(yīng)該擁有互聯(lián)網(wǎng)訪問(wèn)能力,也沒(méi)有郵箱賬戶(hù)。
Matt:目前官方的說(shuō)法是,這個(gè)模型至少在短期內(nèi)會(huì)完全封閉,不對(duì)公眾開(kāi)放,未來(lái)可能只會(huì)提供給企業(yè)客戶(hù),對(duì)嗎?
Felix:是的。Project Glasswing 的目標(biāo),是把這個(gè)模型優(yōu)先提供給那些構(gòu)建和維護(hù)我們數(shù)字基礎(chǔ)設(shè)施的人和組織,比如 Linux Foundation。我們的想法是:這些人維護(hù)著我們每天使用電腦、手機(jī)時(shí)所依賴(lài)的底層系統(tǒng),我們希望給他們一個(gè)“領(lǐng)先優(yōu)勢(shì)”,讓他們先用這個(gè)模型去加固防御,在大眾還無(wú)法使用類(lèi)似能力之前,就提前發(fā)現(xiàn)并修復(fù)潛在的安全漏洞。
Matt:所以它并不屬于 Sonnet 系列?不是 Sonnet 4.7 的延續(xù)?
Felix:對(duì),目前它是一個(gè)獨(dú)立分類(lèi)下的 preview 模型。
Matt:聽(tīng)起來(lái)確實(shí)像是一個(gè)“斷層式”的時(shí)刻。而你剛才提到“有點(diǎn)可怕”,也不僅僅是修辭。
Felix:是的。我覺(jué)得 Anthropic 一直以來(lái)的立場(chǎng)都很明確:AI 可以非常強(qiáng)大、非常有益,但同時(shí)也存在風(fēng)險(xiǎn),必須嚴(yán)肅對(duì)待。而這一次,我們算是第一次真正在實(shí)踐中看到這種情況。當(dāng)你擁有一個(gè)很擅長(zhǎng)攻破軟件系統(tǒng)的模型時(shí),你就必須認(rèn)真思考:這意味著什么?我們?cè)撛趺词褂盟咳绾呜?fù)責(zé)任地處理它?
對(duì)我個(gè)人來(lái)說(shuō),這反而讓我挺有成就感的,我很自豪公司在這件事上的處理方式非常克制、負(fù)責(zé)。而且,這并不是我們突然“偶然發(fā)現(xiàn)”一個(gè)強(qiáng)大模型,其實(shí)我們已經(jīng)掌握它一段時(shí)間了。如果是一個(gè)更激進(jìn)的公司,可能早就把它推向市場(chǎng),定個(gè)高價(jià),然后迅速變現(xiàn)。
Matt:在 Anthropic 這種公司內(nèi)部,新模型發(fā)布時(shí)是怎么運(yùn)作的?因?yàn)樵谛袠I(yè)里,每次有新模型出來(lái),harness 制定者、應(yīng)用團(tuán)隊(duì)都會(huì)迅速適配。你們內(nèi)部也是這樣嗎?需要重新跑所有 eval?
Felix:某種程度上是的,但方式稍微不一樣。我們?cè)谟?xùn)練模型時(shí),本來(lái)就會(huì)把產(chǎn)品需求考慮進(jìn)去。產(chǎn)品會(huì)影響研究方向,研究反過(guò)來(lái)也會(huì)塑造產(chǎn)品,這是一個(gè)雙向過(guò)程。
一方面,我們會(huì)嘗試讓模型具備那些真正能為人類(lèi)創(chuàng)造價(jià)值的能力;另一方面,就像我剛才說(shuō)的,我們也無(wú)法完全預(yù)知模型會(huì)擅長(zhǎng)什么,所以這更像是一種“共舞”。我們通過(guò)產(chǎn)品去觀察:用戶(hù)真正受益的是什么;同時(shí),如果模型突然展現(xiàn)出某種意料之外的能力,那可能就是我的工作去思考:我們?nèi)绾伟堰@個(gè)能力轉(zhuǎn)化成一個(gè)用戶(hù)真正能用的東西。
不過(guò)隨著模型越來(lái)越強(qiáng),我反而覺(jué)得“產(chǎn)品側(cè)的滯后”比模型更明顯。換句話(huà)說(shuō),模型能力的增長(zhǎng)速度,已經(jīng)開(kāi)始超過(guò)我們把它變成產(chǎn)品的能力。
如果你看整個(gè)行業(yè),不只是 AI 原生公司,而是整個(gè)軟件行業(yè)、知識(shí)工作領(lǐng)域,甚至制造業(yè)、科研、醫(yī)療,你會(huì)發(fā)現(xiàn),現(xiàn)在的模型已經(jīng)非常強(qiáng)大了。它們可以處理長(zhǎng)周期任務(wù),也能處理非常復(fù)雜的問(wèn)題。但我們還處在一個(gè)階段:努力弄清楚如何“包裝”這些能力,以最好的形式交付給用戶(hù)。同時(shí),整個(gè)行業(yè)也在摸索:在這樣一個(gè)“模型驅(qū)動(dòng)”的世界里,工作該如何重新組織,才能最大化利用這些能力。
我經(jīng)常去見(jiàn)客戶(hù),很少有那種情況是我走出他們辦公室時(shí)覺(jué)得:“我們需要把模型在某個(gè)能力上再訓(xùn)練得更強(qiáng)一點(diǎn)。”更常見(jiàn)的情況是:我會(huì)被他們組織工作的方式驚到,原來(lái)可以這樣用模型;或者我很確信,他們的問(wèn)題其實(shí)現(xiàn)在的模型就能解決,只是我們還沒(méi)有提供合適的 UI、合適的能力封裝、或者足夠順滑的 onboarding,讓他們輕松用起來(lái)。
10 天做出 Claude Cowork
Matt:外界一直流傳一個(gè)說(shuō)法,說(shuō) Cowork 基本是在 10 天左右“寫(xiě)出來(lái)的”。真實(shí)情況是什么?那 10 天到底發(fā)生了什么?Cowork 真的是完全靠 Claude Code 搭出來(lái)的嗎?
Felix:我能理解為什么這個(gè)說(shuō)法會(huì)在軟件圈傳開(kāi),畢竟現(xiàn)實(shí)是沒(méi)有任何軟件是“從零開(kāi)始”的。
當(dāng)時(shí)大家引用的是我說(shuō)過(guò)的一句話(huà):“我的團(tuán)隊(duì)在最后大概 10 天時(shí)間里做了一次沖刺”,這句話(huà)本身是準(zhǔn)確的。我們確實(shí)是在發(fā)布前 10 天左右聚在一起,我當(dāng)時(shí)跟團(tuán)隊(duì)說(shuō):“我們差不多該發(fā)點(diǎn)東西了,那我們到底要發(fā)什么?長(zhǎng)什么樣?叫什么名字?能做什么?”
但任何做過(guò)軟件的人都知道,你不會(huì)從 0 和 1 開(kāi)始寫(xiě)起。你會(huì)用各種已有的 library,也會(huì)基于過(guò)去積累的 research。在 Anthropic 內(nèi)部,關(guān)于我當(dāng)時(shí)想解決的核心問(wèn)題——“如何讓 Claude Code 的能力更容易在非編程場(chǎng)景比如更廣義的知識(shí)工作中使用”,其實(shí)已經(jīng)有很多非常聰明的人思考了很久。
所以說(shuō) Anthropic 之前沒(méi)有考慮過(guò)這個(gè)問(wèn)題,是不準(zhǔn)確的;但說(shuō)我完全是“空降”這個(gè)問(wèn)題、沒(méi)有受益于之前的積累,也同樣不對(duì)。
Matt:這個(gè)產(chǎn)品的起源是什么?你們一開(kāi)始已經(jīng)有 Claude Code,那是什么時(shí)候開(kāi)始意識(shí)到需要做 Cowork?是用戶(hù)使用方式帶來(lái)的變化嗎?
Felix:我真正形成這個(gè)判斷,其實(shí)是在 2025 年 12 月。
我在社交媒體上開(kāi)始看到越來(lái)越多“非開(kāi)發(fā)者”在用 Claude Code,有人寫(xiě)新聞稿,有人做教程,教完全不會(huì)編程的人:“我教你怎么打開(kāi)終端,怎么用 Claude Code,它會(huì)幫你做很多事情。”
確實(shí)有一小部分非開(kāi)發(fā)者,用它來(lái)“直接做軟件開(kāi)發(fā)”,但那只是其中一種用法。我還注意到我們?cè)镜拈_(kāi)發(fā)者用戶(hù),那些每天用 Claude Code 寫(xiě)代碼的人,始用它做一些完全不是軟件開(kāi)發(fā)的事情。這其實(shí)釋放出一種非常強(qiáng)烈的“潛在需求”。
有個(gè)我很喜歡的判斷標(biāo)準(zhǔn):如果用戶(hù)愿意“爬玻璃也要用你的產(chǎn)品”,哪怕這個(gè)產(chǎn)品還很不好用,那基本說(shuō)明這是一個(gè)值得投入的方向。
真正的起點(diǎn)是,我的同事 Boris Cherny 跑來(lái)跟我說(shuō):“我覺(jué)得你應(yīng)該做點(diǎn)東西,而且最好這周五之前上線(xiàn)。”我把 ddl 從周五談判到了周一,給自己多爭(zhēng)取了一個(gè)周末。然后我們拉了一個(gè)小團(tuán)隊(duì),快速驗(yàn)證一個(gè)想法:如何讓 Claude Code 在“非編程場(chǎng)景”下也變得非常高效。
從構(gòu)成上來(lái)說(shuō),Cowork 其實(shí)很簡(jiǎn)單。我們做的事情是:給 Claude Code 加了一臺(tái)“虛擬機(jī)”,讓 Claude 可以在里面運(yùn)行自己寫(xiě)的代碼。
這臺(tái)虛擬機(jī)帶來(lái)了幾個(gè)關(guān)鍵好處。第一,它提供了非常強(qiáng)的安全邊界。作為用戶(hù),你不再需要時(shí)刻盯著它,因?yàn)樗魂P(guān)在一個(gè)沙盒里,和你的電腦、文件、網(wǎng)絡(luò)都是隔離的,只能訪問(wèn)你明確授權(quán)的域名和文件。
第二,為了讓 Claude Code 發(fā)揮最大效能,它其實(shí)是需要 developer tooling 的。Claude 很擅長(zhǎng)解決各種任務(wù),但它經(jīng)常的做法是:寫(xiě)一些非常定制化的小程序來(lái)完成目標(biāo)。給它一臺(tái)“自己的電腦”之后,它就可以自己搭建開(kāi)發(fā)環(huán)境,而不會(huì)影響你的系統(tǒng)。再加上一些 UI 層的優(yōu)化,讓使用更順手、更優(yōu)雅,簡(jiǎn)化那些原本更偏開(kāi)發(fā)者的流程,最后我們得到的,就是一個(gè)可以很好支持知識(shí)工作的工具。
Matt:那在 Cowork 里面,“skills” 扮演什么角色?
Felix:skills 本質(zhì)上就是一些 Markdown 文件,用來(lái)告訴模型“該怎么做事”。而讓我一直覺(jué)得很神奇的是:這種方式居然這么有效。我對(duì)所有人的建議都是一樣的:就把 Claude 當(dāng)成你的 coworker(同事)。
一個(gè) skill,說(shuō)白了就是一個(gè)文本文件,里面寫(xiě)清楚某件事該怎么做。比如我最常舉的例子是訂機(jī)票。在 Anthropic,我們有指定的差旅供應(yīng)商,所以你不能直接去 Google Flights,而是要用內(nèi)部指定的系統(tǒng),還要遵守各種規(guī)則。
這件事我怎么教同事,就可以怎么教模型。我只需要寫(xiě)一個(gè)文件:“這是訂機(jī)票的流程,去這個(gè)網(wǎng)站,注意這些規(guī)則……”然后再加一點(diǎn)個(gè)人偏好,比如:不要紅眼航班;如果要從舊金山飛紐約,盡量訂下午 4 點(diǎn)的航班。把這些寫(xiě)進(jìn)去之后,模型就能非常好地理解并執(zhí)行。
Matt:那整個(gè)系統(tǒng)的“intelligence layer(智能層)”還是在模型本身,對(duì)吧?比如 Cowork 如何把一個(gè)任務(wù)拆解成多個(gè)子任務(wù),這些都是模型在做?
Felix:是的,不過(guò)是“模型 + 人”的協(xié)作。我們比較滿(mǎn)意的一點(diǎn),是任務(wù)列表的設(shè)計(jì)方式。模型會(huì)被引導(dǎo)去把一個(gè)項(xiàng)目拆解成多個(gè)任務(wù),而你可以隨時(shí)介入:編輯任務(wù)列表、點(diǎn)開(kāi)某個(gè)子任務(wù)、補(bǔ)充更多上下文。所以智能確實(shí)在模型里,但 skills 給它加了一層非常關(guān)鍵的實(shí)用性。
這里有個(gè)挺有意思的變化。我們過(guò)去習(xí)慣用“標(biāo)準(zhǔn)化”的技術(shù)產(chǎn)品,大家用一樣的手機(jī)、一樣的電腦。但模型不一樣,模型其實(shí)非常依賴(lài)一點(diǎn)點(diǎn)指導(dǎo)。就像一個(gè)很聰明的人入職新公司,通常也需要 onboarding,需要有人告訴他:這里事情是怎么做的。
再舉個(gè)更貼近的例子,比如做 presentation 或?qū)懳臋n。如果你有 PowerPoint 或 Google Slides 的模板,你就應(yīng)該告訴 Claude;如果你對(duì)字體有偏好,比如喜歡 serif font 或不喜歡某種風(fēng)格,也都可以寫(xiě)進(jìn)去。只要你把這些偏好用簡(jiǎn)單的指令寫(xiě)下來(lái),模型在實(shí)際幫你做事時(shí)的表現(xiàn)會(huì)好很多,你也不需要反復(fù)修改、盯著它“帶娃式”糾正。
Matt:那 Cowork 的記憶是怎么實(shí)現(xiàn)的?它是存在模型里,還是在外層的 harness 里?
Felix:在 harness 這一層。所謂“記憶”,本質(zhì)上就是文本文件。就是模型被明確指示:如果你覺(jué)得有一些信息未來(lái)可能還會(huì)用到,那就把它寫(xiě)下來(lái)。我們會(huì)在這個(gè)基礎(chǔ)上幫模型做一點(diǎn)點(diǎn)組織,比如你可以設(shè)置項(xiàng)目級(jí)別的獨(dú)立記憶,也可以有全局記憶。但整體來(lái)說(shuō),這套疊加在模型之上的機(jī)制,并不是什么復(fù)雜炫技的數(shù)據(jù)庫(kù)系統(tǒng),它其實(shí)非常樸素。
Matt:那 Cowork 是怎么接入各種信息源或應(yīng)用的?是通過(guò) connectors?MCP(Model Context Protocol)?還是多種方式組合?
Felix:是組合使用的。
我一直有個(gè)很強(qiáng)的判斷:你工作所需的數(shù)據(jù),基本分布在兩個(gè)地方。第一類(lèi)是在你本地電腦上。作為做產(chǎn)品的人,我們必須認(rèn)真對(duì)待這一點(diǎn):用戶(hù)是在用電腦,而不是只用 iPad。并不是所有東西都在云端,文件夾依然很重要。這是一類(lèi)上下文來(lái)源。你可以直接拖文件進(jìn)來(lái),或者給 Claude 訪問(wèn)某個(gè)文件夾、甚至多個(gè)文件夾的權(quán)限。
第二類(lèi),是云端或互聯(lián)網(wǎng)里的數(shù)據(jù),比如 data warehouse、analytics 系統(tǒng)、SharePoint 等等。針對(duì)這些,我們提供多種接入方式,其中 MCP connectors 是一個(gè)很強(qiáng)大的方式。
另外,因?yàn)?Claude 本身“有一臺(tái)電腦”,如果你允許,它也可以直接訪問(wèn)互聯(lián)網(wǎng)。當(dāng)然你可以精細(xì)控制:哪些網(wǎng)站能訪問(wèn),哪些不能。但總體來(lái)說(shuō),只要資源在外部存在,而且你授權(quán)了,Claude 基本都能找到辦法去使用它。
本地、云端和信任
Matt:為什么 Cowork 要運(yùn)行在本地電腦上,而不是完全在云端?
Felix:Cowork 現(xiàn)在提供的兩個(gè)最大價(jià)值,其實(shí)就是:訪問(wèn)你的本地電腦,以及訪問(wèn)你的本地文件。那問(wèn)題是,這些不能在云端實(shí)現(xiàn)嗎?比如說(shuō)一個(gè)很典型的例子是 Chrome。如果你授權(quán),Claude 可以用你的 Chrome,可以幫你回郵件、總結(jié)郵件,或者操作你公司內(nèi)部的工具。
很多人會(huì)問(wèn):那為什么不直接在云端做?
第一是 session。Claude 如果能直接使用你已經(jīng)登錄過(guò)的賬號(hào),價(jià)值是完全不一樣的。比如 Gmail,本身沒(méi)什么用,但“帶著你登錄態(tài)的 Gmail”,對(duì) agent 來(lái)說(shuō)就非常有價(jià)值。第二點(diǎn)更多是工程實(shí)現(xiàn)層面。理論上,我們確實(shí)可以把你的本地 Chrome 打包、上傳到云端,甚至讓你輸入密碼,在云端復(fù)刻整個(gè)環(huán)境。
但我反對(duì)這種做法,主要有兩個(gè)原因。第一是安全性。我不認(rèn)為我們應(yīng)該教育用戶(hù),把所有密碼都交給某一家公司,這不是一個(gè)好的方向。第二是現(xiàn)實(shí)世界的限制。比如銀行,如果它檢測(cè)到你同時(shí)在兩個(gè)地方登錄,一個(gè)是你的電腦,一個(gè)是數(shù)據(jù)中心,它很可能會(huì)直接鎖定你的賬戶(hù),然后要求你帶著護(hù)照去線(xiàn)下網(wǎng)點(diǎn)驗(yàn)證。這類(lèi)長(zhǎng)尾問(wèn)題非常多,而且用戶(hù)體驗(yàn)很差。
對(duì)我來(lái)說(shuō),這種風(fēng)險(xiǎn)是不可接受的。所以在現(xiàn)階段,我更希望 Claude 能“在你工作的地方工作”。你在本地電腦上,它就應(yīng)該在那里。
Matt:那 Computer Use 的出現(xiàn),會(huì)改變這個(gè)判斷嗎?你們最近收購(gòu)了 Vercept,也推出了相關(guān)能力。假設(shè)從云端就能看到整臺(tái)電腦的內(nèi)容,那為什么還需要本地?
Felix:如果我給你一個(gè)“神奇按鈕”,按下去之后,我就把你整臺(tái)電腦的數(shù)據(jù)都吸到云端,你會(huì)按嗎?目前我的觀察是,大多數(shù)人不會(huì)。也許大家會(huì)信任 Anthropic,但要把“全部數(shù)據(jù)”交出去,還是一件非常重的決策。
從技術(shù)上講,其實(shí)確實(shí)沒(méi)有什么“必須在本地運(yùn)行”的硬性限制。我們完全可以把整套系統(tǒng)都搬到云端,甚至遠(yuǎn)程操作你的電腦。但至少在當(dāng)前階段,讓 Claude 在你工作的地方運(yùn)行,不僅更符合用戶(hù)習(xí)慣,也讓我們可以更快迭代,同時(shí)在安全性上做得更嚴(yán)格。
AI 發(fā)展很快,這個(gè)判斷未來(lái)可能會(huì)變。但就現(xiàn)在來(lái)說(shuō),我對(duì)“本地優(yōu)先”這件事還是挺有信心的。
Matt:你剛才提到了“信任”,這是生成式 AI 里一個(gè)很核心的話(huà)題。一方面是你不會(huì)亂訪問(wèn)文件,另一方面是我把越來(lái)越重要的工作交給你,你能不能做好、不會(huì)讓我出丑。作為產(chǎn)品負(fù)責(zé)人,你是怎么建立這種信任的?
Felix:我覺(jué)得在 2026 年做 AI 產(chǎn)品,有一個(gè)很有意思的變化:你做的大多數(shù)按鈕,其實(shí)是“給人用的”,而不是“給機(jī)器用的”。過(guò)去我們?cè)O(shè)計(jì)界面,是為了讓計(jì)算機(jī)更好地工作,人只是輸入信息的角色;但現(xiàn)在反過(guò)來(lái)了,我們是在幫助人理解、控制、信任這個(gè)系統(tǒng)。
舉個(gè)例子,我們最近上線(xiàn)了一個(gè)叫 dispatch 的功能,可以讓你用手機(jī)和電腦上的 Claude 對(duì)話(huà)。我們當(dāng)時(shí)有意識(shí)地“少放按鈕”。但上線(xiàn)之后,我每天在社交媒體上能收到大概 50 條反饋,說(shuō):“能不能加一個(gè)按鈕,讓 dispatch 直接訪問(wèn)我的本地文件?”
為什么糾結(jié)這個(gè)?因?yàn)楝F(xiàn)在的邏輯是:Claude 本來(lái)就能訪問(wèn)你的文件,但它會(huì)先問(wèn)你:“我可以訪問(wèn)你的 downloads 文件夾嗎?”你授權(quán)之后它才會(huì)去做。
所以問(wèn)題變成:我們要不要加一個(gè)按鈕,讓用戶(hù)“顯式知道”這個(gè)能力存在?這就回到你問(wèn)的信任問(wèn)題。我們的思路,其實(shí)不是讓 Claude 去“證明自己”,而是一步步帶著用戶(hù)成長(zhǎng),讓他們逐漸理解系統(tǒng)的能力。
比如 Cowork 剛上線(xiàn)時(shí),其實(shí)已經(jīng)能做很多很復(fù)雜的事情,比如寫(xiě) 200 頁(yè)的 VC 報(bào)告、做蛋白質(zhì)建模、設(shè)計(jì)復(fù)雜架構(gòu)圖等等。但真正打動(dòng)用戶(hù)的,是一句簡(jiǎn)單的:“幫我整理桌面。”這是一個(gè)對(duì) AI 來(lái)說(shuō)很簡(jiǎn)單、甚至有點(diǎn)“沒(méi)必要”的任務(wù),但它是一個(gè)很好的起點(diǎn)。
另一個(gè)例子是“定時(shí)任務(wù)”。從技術(shù)角度講,這也不新鮮,延遲執(zhí)行函數(shù)早就有了。但這里的關(guān)鍵是:我們?cè)诮逃脩?hù)一件事:你可以不盯著它。你可以讓 Claude 每天幫你總結(jié)會(huì)議、寫(xiě)報(bào)告,然后它完成后發(fā)郵件給你,你不需要坐在電腦前盯著它執(zhí)行。這個(gè)過(guò)程其實(shí)是在逐步建立信任:先從小任務(wù)開(kāi)始,用戶(hù)看到結(jié)果可靠,然后自然會(huì)把更重要的事情交給它。
所以信任的本質(zhì),是 Claude 承諾一個(gè)結(jié)果,最終交付的結(jié)果是好的,而且你不需要“帶娃式”監(jiān)督或頻繁介入,信任就是這樣一點(diǎn)點(diǎn)積累起來(lái)的。
AI Agent 時(shí)代怎么做產(chǎn)品?
Matt:在 AI agent 的成功里,UX 和底層技術(shù)一樣重要嗎?比如說(shuō),如何把用戶(hù)一步步帶入,讓他們真正用起來(lái)、用得好。你在做 AI agent 的過(guò)程中,有哪些 UX 層面的經(jīng)驗(yàn)?
Felix:UX 非常重要。Claude Code 的起點(diǎn)其實(shí)就是一個(gè) UX 的變化:同樣是 Claude,但不再只是“在云端對(duì)話(huà)”,而是運(yùn)行在你本地電腦的終端里。這背后幾乎完全是體驗(yàn)層的改變,模型本身沒(méi)有變,核心能力也沒(méi)有變。很多價(jià)值,其實(shí)就是從“你怎么和模型交互”里產(chǎn)生的。
那些真正被用戶(hù)喜歡的 AI 產(chǎn)品,很少是“原始能力最強(qiáng)”的那一類(lèi)。這不僅僅適用于 AI,而是整個(gè)軟件行業(yè)的普遍規(guī)律。比如說(shuō)郵箱,市面上肯定有不少產(chǎn)品,功能比 Gmail 更多、更復(fù)雜,很多公司總是試圖靠“加功能”“多按鈕”來(lái)領(lǐng)先。
這讓我想到智能手機(jī)之前的那段時(shí)間,出現(xiàn)的各種奇怪手機(jī):帶投影儀的、帶游戲手柄的、有全鍵盤(pán)的、沒(méi)鍵盤(pán)的……大家不斷往上“堆功能”。但最終真正成功的產(chǎn)品,往往不是“加了什么”,而是“去掉了什么”。它更關(guān)乎一種感覺(jué):用起來(lái)是什么體驗(yàn)。說(shuō)實(shí)話(huà),我不太相信大多數(shù)人是看參數(shù)表來(lái)買(mǎi)手機(jī)的,人們做決定的原因往往不是芯片性能這些指標(biāo)。
AI 其實(shí)很類(lèi)似。當(dāng)然,更強(qiáng)的模型確實(shí)會(huì)帶來(lái)優(yōu)勢(shì)。我在 Anthropic 工作,可以直接和研究團(tuán)隊(duì)合作,擁有很強(qiáng)的模型,這是一個(gè)客觀優(yōu)勢(shì)。但如果有一天有人在產(chǎn)品上打敗我,我很懷疑那是因?yàn)樗麄冏龀隽恕案鼜?qiáng)的模型”。更可能的原因是:他們做出了更好的用戶(hù)體驗(yàn)。
Matt:在實(shí)踐層面,你們是怎么優(yōu)化用戶(hù)體驗(yàn)的?你們會(huì)不會(huì)非常精細(xì)地追蹤用戶(hù)行為?比如什么好用、什么不好用,然后重點(diǎn)投入?
Felix:我們的方法其實(shí)并不算特別獨(dú)特。有一件事對(duì)我來(lái)說(shuō)比較新:對(duì)用戶(hù)的極致關(guān)注。去和真實(shí)的人交流,優(yōu)先做快速迭代,而不是長(zhǎng)期規(guī)劃。我們基本不會(huì)規(guī)劃超過(guò)一個(gè)月的 roadmap,Cowork 的整個(gè)產(chǎn)品路線(xiàn)圖,最長(zhǎng)也就是一個(gè)月。我們更關(guān)注的是:下周做什么?下下周做什么?至于一年后的產(chǎn)品長(zhǎng)什么樣,說(shuō)實(shí)話(huà),我們沒(méi)什么信心。任何人如果告訴我,他知道 AI 一年后會(huì)是什么樣,我也不會(huì)太信服。
我過(guò)去做過(guò)的所有成功產(chǎn)品,之所以變好,都是因?yàn)槲矣泻芏啻巍凹m偏”的機(jī)會(huì),可以犯點(diǎn)小錯(cuò)、比較不同方案、不斷調(diào)整方向。但現(xiàn)在有一個(gè)全新的變化:執(zhí)行成本幾乎為零。如果你帶著 10 個(gè)想法來(lái)找我,我現(xiàn)在的反應(yīng)是:那我們就把 10 個(gè)全做出來(lái)試試,看看哪個(gè)更好。
我們盡量在內(nèi)部測(cè)試這些東西,而不是把用戶(hù)當(dāng)成免費(fèi)的 beta tester。但大多數(shù)時(shí)候,你其實(shí)很快就能判斷一個(gè)方向?qū)Σ粚?duì)。現(xiàn)在公司規(guī)模也不小了,很容易驗(yàn)證:這個(gè)東西是不是至少能打動(dòng) 5 個(gè)人。真正“新”的,是這種執(zhí)行速度。哪怕是兩年前,如果你想快速迭代,也必須非常克制,因?yàn)橘Y源有限,一次只能做少數(shù)幾件事。但現(xiàn)在,執(zhí)行變得極其便宜,你可以同時(shí)“做深”和“做廣”。
Matt:你們真的會(huì)同時(shí)做 10 個(gè)版本甚至 10 個(gè)產(chǎn)品,然后讓內(nèi)部的人測(cè)試,最后再?zèng)Q定走哪個(gè)方向?
Felix:實(shí)際上不止 10 個(gè),我們現(xiàn)在公司內(nèi)部,可能有 100 個(gè)不同的原型在跑。當(dāng)然,這些原型大多數(shù)還沒(méi)達(dá)到可以給用戶(hù)看的程度。但能在內(nèi)部快速做出來(lái)的數(shù)量,遠(yuǎn)遠(yuǎn)超過(guò)我過(guò)去任何時(shí)候的經(jīng)驗(yàn)。
以前最大的限制是執(zhí)行成本。比如你有一個(gè)好點(diǎn)子,來(lái)找我,我可能會(huì)說(shuō):“我們下個(gè)月排期,這個(gè)要做三周,在那之前你先去找用戶(hù)驗(yàn)證一下。”但現(xiàn)在,你可以走過(guò)來(lái)說(shuō):“我有個(gè)想法。”我會(huì)說(shuō):“給我 10 分鐘,我給你一個(gè)版本。”這種變化,有點(diǎn)像從“繪畫(huà)”進(jìn)入“攝影時(shí)代”。
Matt:當(dāng)你有 100 個(gè)原型之后,真正的瓶頸是什么?總要有人做選擇,這一步是不是會(huì)變慢?
Felix:是的,我覺(jué)得“alignment(對(duì)齊)”依然很難,而且一直都很難。公司里有不同的人、不同的想法,你選誰(shuí)?怎么選?怎么把不同方案里的優(yōu)點(diǎn)組合起來(lái)?這些問(wèn)題依然存在,而且這部分仍然高度依賴(lài)人。換句話(huà)說(shuō),這正是“人類(lèi)判斷”和“taste(品味)”發(fā)揮作用的地方。
Matt:品味是不是正在成為一種更核心的能力?
Felix:是的,品味的重要性在上升。
Matt:但這又和剛才說(shuō)的數(shù)據(jù)驅(qū)動(dòng)有點(diǎn)沖突?一方面你會(huì)測(cè)試、看數(shù)據(jù),但另一方面又有一些更難量化的判斷。
Felix:對(duì)。數(shù)據(jù)驅(qū)動(dòng)的價(jià)值在于:幫你驗(yàn)證你的“品味”是否真的被用戶(hù)認(rèn)可,幫你判斷方向是不是對(duì)的。即使是那些我們認(rèn)為“品味很好”的人,比如早期做出 iPhone 的團(tuán)隊(duì),他們也非常強(qiáng)調(diào)持續(xù)迭代和測(cè)試。Ken Kocienda 在《Creative Selection》這本書(shū)里寫(xiě)得很好:你需要品味,但你也必須不斷驗(yàn)證。我覺(jué)得這兩者是同時(shí)存在的。
而從更大的視角來(lái)看,我甚至在想:軟件會(huì)不會(huì)越來(lái)越像時(shí)尚行業(yè)?現(xiàn)在手機(jī)其實(shí)已經(jīng)有點(diǎn)這個(gè)趨勢(shì)了。會(huì)有一個(gè)“基礎(chǔ)性能”和“基礎(chǔ)能力”的下限,但真正決定差異的,可能是:你講了什么樣的故事、你的 onboarding 做得怎么樣、用戶(hù)在使用時(shí)的感受如何。這些因素,很可能會(huì)比“模型本身有多強(qiáng)”更重要。
Matt:在 Cowork 的業(yè)務(wù)背景下,這種“品味”是如何運(yùn)作的?你需要服務(wù)極其廣泛的專(zhuān)業(yè)群體,有做營(yíng)收運(yùn)營(yíng)的,有做市場(chǎng)營(yíng)銷(xiāo)的,甚至還有律師和會(huì)計(jì)。當(dāng)受眾如此寬泛時(shí),“品味”意味著什么?你又是如何去測(cè)試它的?
Felix:我反復(fù)提到“手機(jī)”的類(lèi)比。我們所有人拿到手的可能都是同款手機(jī),但世界上沒(méi)有兩部手機(jī)是完全一樣的。你安裝的 App 組合讓你的手機(jī)像指紋一樣獨(dú)一無(wú)二。我們從同樣的設(shè)備出發(fā),但它融入我們生活的方式卻各不相同,非常個(gè)性化。
對(duì)于 Cowork 來(lái)說(shuō),我們的思路很像:我們希望打造一種通用性極強(qiáng)的東西,可以應(yīng)用在生活的方方面面。拿我自己的生活來(lái)說(shuō),我最近正在搬家,涉及 500 多頁(yè)寫(xiě)滿(mǎn)復(fù)雜術(shù)語(yǔ)的合同,很多詞我根本看不懂,這時(shí)候 Cowork 就非常有用了。同時(shí),它在醫(yī)療場(chǎng)景下也幫了我大忙,我女兒今年剛出生,處理那些堆積如山的醫(yī)療賬單和表格時(shí),它也發(fā)揮了巨大作用。
一邊是房貸申請(qǐng)、和搬家公司談判、處理財(cái)務(wù)申請(qǐng),另一邊則是純粹的醫(yī)療文書(shū)。從理論上講,這是同一種底層技術(shù)的兩個(gè)完全不同的應(yīng)用。但我發(fā)現(xiàn),我腦子里思考的那些 primitives(基本原語(yǔ))其實(shí)是一樣的。有些原語(yǔ)打磨得更好,手感更順滑。
我認(rèn)為,作為一個(gè)產(chǎn)品締造者,如果你密切關(guān)注并深度使用自己的產(chǎn)品,你能感覺(jué)到那種“撞在軟件墻上”的生澀感。那種感覺(jué)很不爽,它沒(méi)有讓你起飛,而我想要?jiǎng)?chuàng)造更多能讓人“飛起來(lái)”的時(shí)刻。即使客戶(hù)所在的行業(yè)我完全不懂,我也可以從他們的故事中聽(tīng)出:哪些功能讓他們?nèi)缁⑻硪恚男┉h(huán)節(jié)讓他們覺(jué)得被拖累。如果你能敏銳地捕捉并激進(jìn)地去優(yōu)化這些點(diǎn),讓用戶(hù)進(jìn)入那種“flow(心流)”狀態(tài),感覺(jué)討厭的繁瑣工作被自動(dòng)接管了,那這里面就蘊(yùn)含著巨大的價(jià)值。
Matt:打造 Claude Cowork 最難的部分是什么?
Felix:我在想,如果重新來(lái)一遍,換個(gè)產(chǎn)品,什么是最難被“復(fù)刻”的?我覺(jué)得是那種“時(shí)機(jī)感”。我之前提到過(guò),Cowork 的誕生是因?yàn)槲覀円恢本o貼地面,敏銳察覺(jué)到了潛在需求。這種潛在需求是上天的饋贈(zèng),你很難憑空創(chuàng)造它。
軟件行業(yè)其實(shí)一直存在大量的潛在需求,只要你有心去找,總能發(fā)現(xiàn)。所以,如果說(shuō)構(gòu)建 Cowork 的核心難點(diǎn),我倒不覺(jué)得有什么技術(shù)細(xì)節(jié)特別難。做出一款好產(chǎn)品該有的難點(diǎn)它都有,比如所謂的“成長(zhǎng)的煩惱”:如果你開(kāi)了一家咖啡館,原本準(zhǔn)備接待 10 個(gè)人,結(jié)果來(lái)了 2000 萬(wàn)人,你該怎么辦?這對(duì)我們來(lái)說(shuō)有時(shí)確實(shí)挺難的。Anthropic 的產(chǎn)品需求量實(shí)在太驚人了,當(dāng)然,作為產(chǎn)品負(fù)責(zé)人,我也沒(méi)資格抱怨大家太愛(ài)用我的產(chǎn)品。
Matt:如果有人正在構(gòu)建某種 AI Agent,關(guān)于開(kāi)發(fā)流程、構(gòu)建 Harness、專(zhuān)業(yè)化定制、或者是加裝 Guardrails 和行業(yè)深耕,有什么經(jīng)驗(yàn)可以分享嗎?
Felix:我首先會(huì)建議不要自己去造太多的底層輪子,可以試試我們剛推出的 Claude Managed Agents,它在很多場(chǎng)景下非常管用。
關(guān)于構(gòu)建自定義 Agent,有正反兩個(gè)維度的思考。反對(duì)過(guò)度定制的理由是:隨著模型能力越來(lái)越強(qiáng),我發(fā)現(xiàn)我們?cè)诋a(chǎn)品開(kāi)發(fā)中需要考慮的 Edge Cases(邊界案例)反而變少了。我之前說(shuō)過(guò),記憶其實(shí)就是一個(gè)文本文件,如果 Claude 需要數(shù)據(jù)庫(kù),它自己就能造一個(gè)。所以,如果你想做一個(gè)超垂直、超專(zhuān)業(yè)化的產(chǎn)品,邏輯前提可能是模型還沒(méi)強(qiáng)到能隨時(shí)隨地“現(xiàn)造”這些功能。如果模型以后能即時(shí)搞定一切,那你的專(zhuān)業(yè)化門(mén)檻可能就不存在了。
但是,支持投入這個(gè)領(lǐng)域的理由也很充分:整個(gè)行業(yè)要真正發(fā)揮出這種力量,還有很長(zhǎng)的路要走。大家總喜歡用各種閃亮的類(lèi)比來(lái)定義 AI,說(shuō)它是像互聯(lián)網(wǎng)、蒸汽機(jī)那樣的發(fā)明。我覺(jué)得互聯(lián)網(wǎng)帶給我們的教訓(xùn)是:一項(xiàng)技術(shù)真正轉(zhuǎn)化并重塑經(jīng)濟(jì)邏輯,需要幾十年的時(shí)間。從第一個(gè)瀏覽器問(wèn)世,到 Amazon 成為零售巨頭,中間隔了太久。
所以,我的觀點(diǎn)是:你應(yīng)該深入進(jìn)去,尋找那些獨(dú)特且新穎的應(yīng)用場(chǎng)景。不過(guò),你提供的價(jià)值可能并不在于 Agent 本身,也不在于模型的智商,而在于你如何幫助人們組織工作。如何讓它變得真正“好用”,這才是關(guān)鍵。
SaaS 的末日?
Matt:幾周前,你們發(fā)布了一個(gè)看似尋常的公告,結(jié)果市場(chǎng)反應(yīng)劇烈,媒體甚至稱(chēng)之為“SaaS-Pocalypse(SaaS 啟示錄)”。當(dāng)時(shí)你們只是增加了 10 到 11 個(gè)關(guān)于法律和 CRM 之類(lèi)的文件支持。顯然,無(wú)論市場(chǎng)情緒如何波動(dòng),這都反映出你們所構(gòu)建的 Cowork 以及 Anthropic 整體所具備的影響力。
你們做了 Claude Code,解決了開(kāi)發(fā)者的痛點(diǎn);做了 Cowork,服務(wù)了所有人;現(xiàn)在又推出了 Managed Agents。當(dāng)你們不斷往技術(shù)棧的上層走,軟件行業(yè)還有什么空間留給后來(lái)者嗎?
Felix:我經(jīng)歷過(guò)好幾輪這種“民主化”浪潮,也就是構(gòu)建事物的門(mén)檻越來(lái)越低,不再需要那些晦澀的專(zhuān)業(yè)知識(shí)。
舉個(gè)例子:多年前我在 Microsoft 工作,參與了一個(gè)叫 Electron 的項(xiàng)目,這是一種讓?xiě)?yīng)用能在 Windows 和 macOS 上跨平臺(tái)運(yùn)行的技術(shù)。我們當(dāng)時(shí)第一個(gè)應(yīng)用案例就是 Visual Studio Code,這是一款后來(lái)在開(kāi)發(fā)者中變得非常流行的代碼編輯器,像 Cursor 這樣的產(chǎn)品也是在它之上構(gòu)建的。當(dāng)年 VS Code 在公司內(nèi)部剛推出時(shí),很多人覺(jué)得這就是個(gè)“玩具”,覺(jué)得真正的開(kāi)發(fā)者需要的是 Visual Studio 這種功能復(fù)雜、工具高級(jí)的大家伙。
但結(jié)果呢?你不再需要鉆研得那么深了。對(duì)于做軟件的聽(tīng)眾來(lái)說(shuō),我這周感觸很深:今年我查看 Assembly(匯編語(yǔ)言)的次數(shù)是零。而在過(guò)去五年里,這個(gè)數(shù)字從來(lái)不是零。
最近作家 Margaret Atwood 寫(xiě)了一篇非常精彩的文章,講她如何使用 Claude。我在想,如果讓 Margaret Atwood 來(lái)寫(xiě)軟件,那個(gè)軟件會(huì)是什么樣?我肯定非常有興趣裝一個(gè)來(lái)試試。
所以我的預(yù)測(cè)是:未來(lái)我們將擁有更多的軟件,而且會(huì)更加專(zhuān)業(yè)化。并不是說(shuō)每個(gè)人都會(huì)親手寫(xiě)軟件,人們依然會(huì)創(chuàng)造并分享,大家也依然喜歡好用的工具,只是所需的技能點(diǎn)變了。以前是你必須精通“計(jì)算機(jī)的語(yǔ)言”,而未來(lái),你會(huì)更傾向于做一個(gè)精通“人類(lèi)語(yǔ)言”的人,軟件將真正地“為人而造”。
Matt:這是否意味著一切最終都會(huì)歸結(jié)為 UX 的問(wèn)題?
Felix:20 年前成功的軟件開(kāi)發(fā)者是“計(jì)算機(jī)專(zhuān)家”,而未來(lái)的成功者將是那些深度理解人類(lèi)和用戶(hù)需求的人。這一直是一個(gè)漸進(jìn)的過(guò)程,10 年前寫(xiě)軟件就比 30 年前容易得多,AI 則是另一個(gè)階躍式的變化。
至于市場(chǎng)表現(xiàn),我不是經(jīng)濟(jì)學(xué)家,我是個(gè)軟件工程師。我從來(lái)沒(méi)搞懂過(guò)市場(chǎng)是怎么運(yùn)作的,我也建議其他工程師不要把自己的行動(dòng)指南完全建立在市場(chǎng)波動(dòng)上。
我覺(jué)得還有堆積如山的事情等著我們?nèi)プ詣?dòng)化,還有無(wú)數(shù)的工作可以變得更輕松。只要人類(lèi)還有問(wèn)題和麻煩,軟件就會(huì)是一個(gè)合理的答案。
Matt:跳出具體的產(chǎn)品細(xì)節(jié),你認(rèn)為兩三年后 Agent 的能力未來(lái)會(huì)走向何方?
Felix:這對(duì)我來(lái)說(shuō)挺難回答的,因?yàn)槲以瓌t上不喜歡在功能還沒(méi)真正做出來(lái)之前就開(kāi)空頭支票。我的營(yíng)銷(xiāo)哲學(xué)一直都是:先做出酷炫的東西,再展示給人看。
大家似乎總是很快就忘記了 AI 已經(jīng)走了多遠(yuǎn),反而開(kāi)始預(yù)期所謂的“Plateau(平臺(tái)期)”會(huì)很快到來(lái)。我想這可能是科技史給人的刻板印象,就像 iPhone 剛出來(lái)那幾年,每年的更新都是巨變,但最近幾年更新幅度就變小了。
但作為一個(gè) AI 觀察者,我沒(méi)有任何理由認(rèn)為 AI 會(huì)在短期內(nèi)進(jìn)入平臺(tái)期。我想提醒大家,AI 學(xué)會(huì)說(shuō)出像樣的人話(huà)其實(shí)也就這幾年的事,而現(xiàn)在它已經(jīng)能構(gòu)建完整的應(yīng)用、解決復(fù)雜的問(wèn)題了。對(duì)我來(lái)說(shuō),這遠(yuǎn)非巔峰,我們還在半山腰呢。這段旅程正在加速,步子會(huì)邁得越來(lái)越大。Claude Mythos Preview 其實(shí)就是一個(gè)很好的證明:模型會(huì)越來(lái)越聰明,而且目前完全看不到上限。
Matt:你們是否會(huì)讓受規(guī)管行業(yè)更輕松地接入 Cowork?作為一家風(fēng)險(xiǎn)投資機(jī)構(gòu),我們目前在工作場(chǎng)景下還用不了 Cowork,但我私下里一直在用。這在你們的計(jì)劃中嗎?
Felix:你絕不是唯一一個(gè)在為特定受規(guī)管行業(yè)申請(qǐng) Cowork 的人。作為產(chǎn)品人,用戶(hù)的需求就是我們的風(fēng)向標(biāo),我們會(huì)非常認(rèn)真地傾聽(tīng)。
到了 2026 年,最讓我激動(dòng)的依然是:如何幫助人們重新組織工作,從而最大限度地發(fā)揮 AI 的能力。我曾在 Slack 工作過(guò)五年,那時(shí)候我們覺(jué)得自己在幫公司變革辦公方式。雖然我們不是第一個(gè)做聊天工具的,也不是第一個(gè)提出“打破信息孤島”的人。但我們賣(mài)給用戶(hù)的不僅是一個(gè)聊天 App,而是一種更透明、更開(kāi)放的辦公文化。對(duì)于 AI 來(lái)說(shuō),這種變革是相似的:只有當(dāng)你重新審視自己的工作流程,思考哪些部分可以交給模型,哪些部分需要完全掌控時(shí),工具才最有效。
另一個(gè)讓我興奮的領(lǐng)域是:目前使用 AI 的人分為兩類(lèi)。一類(lèi)是我們所說(shuō)的“AGI Pilled(深受 AGI 浸染的人)”,他們?nèi)硇耐度耄芯吭趺丛O(shè)置 Claude、開(kāi)放什么工具權(quán)限、安裝什么 MCP connectors。他們用得飛起,效率極高。而另一類(lèi)人可能沒(méi)那么多時(shí)間或興趣去鉆研。如何縮短這兩類(lèi)人之間的距離,讓普通用戶(hù)也能秒變 Power User,這其中的潛力巨大。在實(shí)踐中,Cowork 的用戶(hù)會(huì)發(fā)現(xiàn)我們幾乎每周都會(huì)發(fā)布意義重大的更新,這件事目前看不到終點(diǎn)。
SaaS 的末日?
Matt:哪一個(gè)想法被嚴(yán)重低估了?
Felix:MCP connectors。包括我在內(nèi),大家現(xiàn)在都在關(guān)注 CLI(命令行界面),但將數(shù)據(jù)與“執(zhí)行引擎”分離,這件事本身有著巨大的內(nèi)在價(jià)值,是一個(gè)非常技術(shù)硬核的觀點(diǎn)。去年秋天 MCP 爆火過(guò)一陣,現(xiàn)在討論變少了,但我認(rèn)為到今年年底或明年,它會(huì)變得極其有用。就像 WebSocket 對(duì) Amazon 或 TikTok 的用戶(hù)來(lái)說(shuō)是不可或缺的底層協(xié)議一樣,用戶(hù)不需要關(guān)心它,但工程師們目前對(duì) MCP 的重視程度還遠(yuǎn)遠(yuǎn)不夠。
Matt:哪一個(gè)想法被過(guò)度神化了?
Felix:我認(rèn)為:并不是每個(gè)產(chǎn)品都需要一個(gè) Chat(聊天框)。在 2026 年的 AI 圈,這聽(tīng)起來(lái)可能有點(diǎn)叛逆。很多同行都有一種膝跳反應(yīng),一說(shuō)要把 AI 引入產(chǎn)品,就立刻在右邊加個(gè)側(cè)邊欄,底下放個(gè)聊天框。我鼓勵(lì) AI 開(kāi)發(fā)者們多想一層:如何讓 AI 以更自然、更有用的方式存在,而不僅僅是對(duì)話(huà)。
Matt:如果你今天白手起家,你會(huì)做什么?
Felix:我可能會(huì)去關(guān)注這個(gè)行業(yè)的“長(zhǎng)尾部分”。比如,世界上還有大量運(yùn)行著 Windows 7 的舊設(shè)備,它們處理著瑣碎的任務(wù),卻在社會(huì)中扮演著承重墻的角色。想想挺嚇人的,這些處于現(xiàn)代 AI 觸角之外的電腦,卻在支撐著重要的社會(huì)功能。
另一個(gè)方向是,如果你相信 AI 的本質(zhì)是計(jì)算機(jī)不再只是執(zhí)行預(yù)設(shè)的功能,而是能非確定性地做出決策并代你執(zhí)行,那我建議去攻占物理世界,這也是我對(duì)年輕人的建議。我們真的還處于非常早期的階段,現(xiàn)在的 AI 產(chǎn)品處于就像是移動(dòng)電話(huà)剛出現(xiàn)的“傻瓜機(jī)時(shí)代”。運(yùn)氣好的話(huà),我們現(xiàn)在做的可能只是“諾基亞 3310”,它是個(gè)好手機(jī),但它還不是智能手機(jī),更不是 iPhone。真正屬于 AI 的“iPhone 時(shí)刻”,正等著某個(gè)人去創(chuàng)造。
訪談視頻原鏈接:
https://www.youtube.com/watch?v=9MEJ4syOVrQ&t=2s
聲明:本文為 InfoQ 翻譯整理,不代表平臺(tái)觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。
會(huì)議推薦
世界模型的下一個(gè)突破在哪?Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過(guò)?研發(fā)體系不重構(gòu),還能撐多久?
AICon 上海站 2026,4 大核心專(zhuān)題等你來(lái):世界模型與多模態(tài)智能突破、Agent 架構(gòu)與工程化實(shí)踐、Agent 安全與可信治理、企業(yè)級(jí)研發(fā)體系重構(gòu)。14 個(gè)專(zhuān)題全面開(kāi)放征稿。
誠(chéng)摯邀請(qǐng)你登臺(tái)分享實(shí)戰(zhàn)經(jīng)驗(yàn)。AICon 2026,期待與你同行。
今日薦文
你也「在看」嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.