網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

唯快不破，Anthropic幾天搞定智能體生產(chǎn)

2026-04-09 13:40:26　來源: 字母榜

北京舉報(bào)

分享至

凌晨，Anthropic 發(fā)布了Claude Managed Agents，一套用于構(gòu)建和部署云端智能體的托管工具。

用最簡單的話來介紹，開發(fā)者不需要再處理安全、狀態(tài)管理和權(quán)限等基礎(chǔ)設(shè)施，能直接讓Agent運(yùn)行在生產(chǎn)環(huán)境。

官方稱，一個(gè)原本需要數(shù)月才能上線的Agent，現(xiàn)在可以在幾天內(nèi)投入生產(chǎn)。

以10倍速度進(jìn)入生產(chǎn)

在此之前，Agent開發(fā)真正的難點(diǎn)從來不在模型本身，而在工程。

我們可以很快用Claude或其他大模型做出一個(gè)看起來不錯(cuò)的demo：能寫代碼、能分析文檔、甚至能自動(dòng)調(diào)用工具。但一旦想把它變成一個(gè)能穩(wěn)定運(yùn)行的產(chǎn)品，問題就出現(xiàn)了。

明明它看起來什么都能做，可就是很難真正用在生產(chǎn)環(huán)境里。

demo做出來以后，開發(fā)者還需要自己搭一整套基礎(chǔ)設(shè)施：安全的代碼執(zhí)行環(huán)境、長時(shí)間運(yùn)行的狀態(tài)管理、不同工具之間的權(quán)限控制，以及在出錯(cuò)時(shí)能夠恢復(fù)的機(jī)制。這些能力每一個(gè)都不算復(fù)雜，但組合在一起，就是一件非常耗時(shí)的大工程了。

更麻煩的是，這些工作幾乎無法復(fù)用。

模型一旦升級，harness里原本寫死的那些假設(shè)往往不再那么適配，不同Agent之間也很難共享一套穩(wěn)定的運(yùn)行框架。

Agent開發(fā)翻來覆去：每個(gè)團(tuán)隊(duì)都在解決同一類問題，但很少有人真正把它做到穩(wěn)定。

因此我們經(jīng)常看到，Agent可以輕松做出demo，卻遲遲才能上線。

Claude Managed Agents試圖解決的正是這一問題：安全執(zhí)行、狀態(tài)管理、權(quán)限控制、錯(cuò)誤恢復(fù)……它把這些原本要自己搭的一整套東西全部打包，統(tǒng)一由Anthropic提供。

開發(fā)者不需要再關(guān)心Agent是怎么跑起來的，只要告訴它做什么、能用什么工具、有哪些限制，剩下的執(zhí)行過程都由系統(tǒng)自動(dòng)完成。

帶來的變化也很直接：原本要花幾個(gè)月搭出來的一整套系統(tǒng)，現(xiàn)在變成了一個(gè)可以快速嘗試、反復(fù)調(diào)用的接口。

它沒有讓Agent變得更聰明，但它狠狠縮短了demo和生產(chǎn)之間的距離。

除了加速上線的“工具包”，它還做了以下幾件事：

首先是對長時(shí)間運(yùn)行任務(wù)的支持。Agent可以在后臺自主運(yùn)行數(shù)小時(shí)，進(jìn)度和輸出會(huì)被持續(xù)保存，即使發(fā)生中斷也不會(huì)丟失。

其次是多Agent之間的協(xié)作能力。Agent可以創(chuàng)建并調(diào)度其他Agent，以并行方式處理復(fù)雜工作。該能力目前以research preview形式提供，需要單獨(dú)申請?jiān)L問。

然后是對真實(shí)系統(tǒng)的訪問與治理機(jī)制。AgentAgent能夠訪問帶有范圍權(quán)限、身份管理和執(zhí)行追蹤的真實(shí)系統(tǒng)，但能調(diào)用哪些工具、拿到哪些權(quán)限、使用哪些憑證，模型自己說了不算。

除此之外，系統(tǒng)還內(nèi)置了一個(gè)用于任務(wù)執(zhí)行的編排機(jī)制（a built-in orchestration harness），用于決定何時(shí)調(diào)用工具、如何管理上下文以及在出現(xiàn)錯(cuò)誤時(shí)如何恢復(fù)。這意味著開發(fā)者無需手動(dòng)編排Agent的執(zhí)行流程，系統(tǒng)會(huì)在運(yùn)行過程中自動(dòng)進(jìn)行調(diào)度。

這些能力本身并不新，但被放進(jìn)同一個(gè)系統(tǒng)里之后，就省下了很多事情。

不只是能用，而是已經(jīng)在用

在發(fā)布中，Anthropic 也給出了一批已經(jīng)落地的案例，基本覆蓋了協(xié)作工具、企業(yè)系統(tǒng)和開發(fā)工具這幾個(gè)典型場景。

例如Notion（一款將文檔、知識庫和項(xiàng)目管理整合在一起的協(xié)作工具）直接把Claude塞進(jìn)了工作區(qū)里：工程師讓它寫代碼，內(nèi)容團(tuán)隊(duì)讓它做網(wǎng)站、做PPT，多個(gè)任務(wù)還能并行。

在企業(yè)側(cè)，Rakuten（日本大型互聯(lián)網(wǎng)與電商集團(tuán)，業(yè)務(wù)涵蓋電商、金融和通信）已經(jīng)在多個(gè)部門部署Agent，包括產(chǎn)品、銷售、市場、財(cái)務(wù)和人力資源。他們的做法很直接：把Agent接進(jìn)Slack和Teams，讓員工像派活一樣分配任務(wù)，然后拿回表格、幻燈片甚至應(yīng)用。官方說，一個(gè)Agent一周就能部署完成。

Asana（一家提供團(tuán)隊(duì)任務(wù)管理和項(xiàng)目協(xié)作工具的軟件公司）的思路更激進(jìn)一點(diǎn)。這家公司本來就是做項(xiàng)目管理的，現(xiàn)在干脆把Agent變成項(xiàng)目成員，直接參與任務(wù)推進(jìn)和內(nèi)容產(chǎn)出，起的名字也很直白：AI Teammates。

開發(fā)者這邊的代表是Sentry（提供錯(cuò)誤監(jiān)控和性能分析的開發(fā)者工具），它原本就是用來監(jiān)控bug的，現(xiàn)在Agent可以自動(dòng)生成修復(fù)代碼并創(chuàng)建Pull Request，把發(fā)現(xiàn)問題到提交修復(fù)的流程串起來。

還有Vibecode（一個(gè)通過自然語言生成并部署應(yīng)用的AI開發(fā)工具平臺），這類AI原生工具走得更遠(yuǎn)一點(diǎn)：用戶只需要寫一句需求，就可以從提示直接生成并部署一個(gè)應(yīng)用，而Managed Agents成了它背后的默認(rèn)基礎(chǔ)設(shè)施。

如此種種可以看出，不管是寫代碼、做內(nèi)容還是處理企業(yè)流程，Agent已經(jīng)開始直接接手任務(wù)了

某種意義上，當(dāng)安全、狀態(tài)、權(quán)限和調(diào)度都變成默認(rèn)能力之后，Agent不再需要被“包裝”成系統(tǒng)，它本身就可以作為系統(tǒng)運(yùn)行。

Agent缺的從來不是能力，只是難以落地而已。

過去開發(fā)者需要先搭好一整套框架，才能讓Agent開始落地干活；現(xiàn)在這套框架已經(jīng)提前存在，Agent可以直接被部署進(jìn)去。

這就是Claude Managed Agents的意義所在。

工具很好，但問題才剛開始

Claude Managed Agents一推出就引發(fā)了大量討論。

很多人對Anthropic的推進(jìn)速度感到驚訝，心情就如同下面的meme：每天一起床就又看到一個(gè)Claude更新。

這不，泄露事件之后立馬更新了Claude Code 2.1.90，Claude Mythos Preview的熱度還沒過，Claude Managed Agents又馬上出來了。

Anthropic你盡管推出，我們一點(diǎn)也不苦一點(diǎn)也不累。

開個(gè)玩笑。在感嘆發(fā)布速度的同時(shí)，對新工具的質(zhì)疑也幾乎同時(shí)出現(xiàn)。

最直接的問題，是它到底能不能真正跑好“長期任務(wù)”。

有開發(fā)者指出，Agent最大的挑戰(zhàn)從來不在短任務(wù)，而是那些需要持續(xù)運(yùn)行、反復(fù)決策的場景。一旦時(shí)間拉長，錯(cuò)誤會(huì)不斷累積，系統(tǒng)穩(wěn)定性也會(huì)迅速下降。

能跑起來，不等于能跑得久。

更進(jìn)一步，是“可靠性”的問題。

在小規(guī)模測試中，Agent往往表現(xiàn)不錯(cuò)，但一旦進(jìn)入真實(shí)生產(chǎn)環(huán)境，任務(wù)復(fù)雜度上升、調(diào)用鏈變長，各種邊界情況就會(huì)不斷出現(xiàn)。

這恰恰是大多數(shù)Agent平臺最容易失效的地方。

還有人把問題問得更實(shí)際一些：既然現(xiàn)在已經(jīng)有多Agent能力，那它到底能不能直接替代現(xiàn)有的工作流工具？

還是說，像n8n這樣的系統(tǒng)，依然是必需的？

本質(zhì)上關(guān)心的還是同一件事：n8n就是為了保證流程穩(wěn)定、可控、可復(fù)現(xiàn)，要想替代它，這套多Agent協(xié)調(diào)的系統(tǒng)必須足夠穩(wěn)定，足夠“可靠”。

值得注意的是，Anthropic在工程設(shè)計(jì)上也在嘗試解決這個(gè)問題。

在最新的技術(shù)文章中，他們將Agent系統(tǒng)拆成三個(gè)獨(dú)立的部分：模型與調(diào)度邏輯（“大腦”）、執(zhí)行環(huán)境與工具（“手”），以及記錄全部過程的會(huì)話日志（session）。

三者通過接口連接，任何一層失敗都可以單獨(dú)恢復(fù)，而不會(huì)影響整體運(yùn)行。

這套設(shè)計(jì)，把Agent從一次性執(zhí)行的流程，變成了一個(gè)可以中斷、恢復(fù)甚至重啟的系統(tǒng)。

另外，對于那些需要長時(shí)間運(yùn)行的任務(wù)，Anthropic沒有把所有信息都塞進(jìn)模型的上下文里，而是記錄在外部日志中，需要時(shí)再取回來用，這樣就不會(huì)占滿上下文窗口。

同樣地，權(quán)限也不再交給模型保管，而是單獨(dú)隔離出去，這樣即使出錯(cuò)，也不會(huì)直接暴露敏感信息。

不過工程設(shè)計(jì)只能解決結(jié)構(gòu)問題，沒辦法保證結(jié)果。

可以說，大家并不懷疑Claude Managed Agents能做什么，懷疑的是它能不能穩(wěn)定、可控地一直做下去。

這一點(diǎn)，就需要時(shí)間來驗(yàn)證了。

Claude Managed Agents介紹：
https://claude.com/blog/claude-managed-agents

工程博客：
https://www.anthropic.com/engineering/managed-agents

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.