PRODUCT
Anthropic 發(fā)布了一個(gè)新的 API 工具,讓 Sonnet 或 Haiku 在跑任務(wù)的過程中,遇到搞不定的決策時(shí)自動請教 Opus,拿到指導(dǎo)后繼續(xù)干活。這個(gè)策略叫 Advisor Strategy,工具叫 Advisor Tool
效果是:智能接近 Opus,成本接近 Sonnet
![]()
Advisor 策略的工作方式:Sonnet 執(zhí)行,遇到難題請教 Opus
反過來的 Sub-Agent 模式
行業(yè)里常見的多 Agent 模式是:大模型當(dāng)指揮官,拆解任務(wù)分給小模型去執(zhí)行。Advisor 策略把這個(gè)方向反過來了
Sonnet(或 Haiku)作為 Executor 全程執(zhí)行任務(wù),調(diào)用工具、讀取結(jié)果、迭代推進(jìn)。當(dāng)它遇到一個(gè)自己判斷力不夠的決策點(diǎn)時(shí),它會調(diào)用 Opus 作為 Advisor。Opus 拿到共享的上下文,返回一個(gè)計(jì)劃、一個(gè)糾正、或者一個(gè)停止信號。然后 Sonnet 繼續(xù)執(zhí)行
Advisor 不調(diào)用工具,不產(chǎn)出面向用戶的輸出,只提供指導(dǎo)。前沿級推理只在 Executor 需要的時(shí)候介入,其余時(shí)間全部按 Executor 的價(jià)格計(jì)費(fèi)
不是大模型指揮小模型干活,是小模型干活遇到難題請教大模型
這個(gè)設(shè)計(jì)的好處是:不需要任務(wù)拆解邏輯,不需要 worker pool,不需要編排框架。Executor 自己判斷什么時(shí)候需要升級,整個(gè)過程在一次 API 調(diào)用里完成
評測數(shù)據(jù)
先看 Sonnet + Opus Advisor 的組合
SWE-bench Multilingual
Sonnet + Advisor 比 Sonnet 單獨(dú)跑提升了 2.7 個(gè)百分點(diǎn),同時(shí)每個(gè)任務(wù)的成本降低了 11.9%。成本降低的原因是 Advisor 的介入讓 Executor 少走彎路,減少了總 token 消耗
![]()
SWE-bench Multilingual:Sonnet + Advisor vs Sonnet Solo vs Opus Solo
BrowseComp 和 Terminal-Bench 2.0
在 BrowseComp 和 Terminal-Bench 2.0 上,Sonnet + Advisor 同樣超過了 Sonnet 單獨(dú)跑,而且每個(gè)任務(wù)的成本更低
![]()
BrowseComp + Terminal-Bench:Sonnet + Advisor 的表現(xiàn)和成本
再看 Haiku + Opus Advisor 的組合,這個(gè)更有趣
在 BrowseComp 上,Haiku + Advisor 得分 41.2%,是 Haiku 單獨(dú)跑(19.7%)的兩倍多。跟 Sonnet 單獨(dú)跑比,分?jǐn)?shù)低了 29%,但成本低了 85%
![]()
BrowseComp:Haiku + Advisor vs Haiku Solo vs Sonnet Solo
對于高吞吐、需要平衡智能和成本的場景,這個(gè)組合很有吸引力。用 Haiku 的價(jià)格拿到接近 Sonnet 水平的結(jié)果
怎么用
API 層面非常簡單。在 Messages API 請求的 tools 數(shù)組里加一個(gè) advisor_20260301 類型的工具,指定 Advisor 模型是 Opus,設(shè)一個(gè) max_uses 限制每次請求最多請教幾次
整個(gè)模型交接在一次 /v1/messages 請求里完成,不需要額外的網(wǎng)絡(luò)來回,不需要自己管理上下文傳遞。Executor 決定什么時(shí)候調(diào)用 Advisor,Anthropic 負(fù)責(zé)把精選的上下文路由給 Advisor 模型,拿到計(jì)劃后 Executor 繼續(xù)執(zhí)行
計(jì)費(fèi)方式:Advisor 的 token 按 Advisor 模型的價(jià)格算(Opus 的 $5/$25),Executor 的 token 按 Executor 模型的價(jià)格算(Sonnet 的 $3/$15 或 Haiku 的 $1/$5)。因?yàn)?Advisor 每次只生成一個(gè)短計(jì)劃(通常 400-700 個(gè) token),整體成本遠(yuǎn)低于全程跑 Opus
可以通過 max_uses 限制 Advisor 調(diào)用次數(shù)來控制成本。Advisor 的 token 消耗在 usage 中單獨(dú)報(bào)告
早期用戶怎么說
在復(fù)雜任務(wù)上做出了更好的架構(gòu)決策,在簡單任務(wù)上沒有任何額外開銷。計(jì)劃和執(zhí)行軌跡完全是兩個(gè)級別
Eric Simmons,Bolt CEO
我們看到了 Agent 輪次、工具調(diào)用次數(shù)和整體分?jǐn)?shù)的明確改善,比我們自己構(gòu)建的 planning 工具效果更好
Kay Zhu,Genspark 聯(lián)合創(chuàng)始人兼 CTO
在結(jié)構(gòu)化文檔提取任務(wù)上,Advisor 讓 Haiku 4.5 按需請教 Opus 4.6,達(dá)到了前沿模型的質(zhì)量,成本低 5 倍
Anuraj Pandey,Eve Legal 機(jī)器學(xué)習(xí)工程師
幾個(gè)信號
第一,這是 Anthropic 第一次在 API 層面提供模型間協(xié)作的原生支持。之前想讓 Sonnet 和 Opus 配合,你得自己寫編排邏輯、管理上下文傳遞、處理兩次 API 調(diào)用的狀態(tài)。現(xiàn)在一個(gè) tool 聲明就搞定
第二,定價(jià)邏輯很巧妙。Advisor 每次只輸出 400-700 個(gè) token 的短計(jì)劃,按 Opus 價(jià)格算也就幾分錢。但這幾分錢的指導(dǎo)可以讓 Executor 少走彎路,減少總 token 消耗。所以出現(xiàn)了「加了 Advisor 反而總成本更低」的現(xiàn)象
花幾分錢請教一次 Opus,省下來的是 Sonnet 走彎路燒掉的幾毛錢
第三,Haiku + Opus Advisor 的組合值得關(guān)注。BrowseComp 41.2% 的成績用 Haiku 的價(jià)格拿到,比 Sonnet 單獨(dú)跑便宜 85%。對于大規(guī)模、成本敏感的 Agent 部署場景,這個(gè)組合可能比 Sonnet 更合適
第四,時(shí)間線繼續(xù)加密。Mythos、Managed Agents、Advisor Tool,Anthropic 在一周內(nèi)連續(xù)發(fā)布了最強(qiáng)模型、Agent 基礎(chǔ)設(shè)施平臺、模型間協(xié)作工具,產(chǎn)品線的密度在快速增加
參考材料
The Advisor Strategy 官方博客https://claude.com/blog/the-advisor-strategy
Advisor Tool API 文檔https://platform.claude.com/docs/en/agents-and-tools/tool-use/advisor-tool
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.