Anthropic 新工具：Sonnet 遇到難題可以請教 Opus 了

2026-04-10 16:18:49　來源: 賽博禪心

北京舉報(bào)

分享至

PRODUCT

Anthropic 發(fā)布了一個(gè)新的 API 工具，讓 Sonnet 或 Haiku 在跑任務(wù)的過程中，遇到搞不定的決策時(shí)自動請教 Opus，拿到指導(dǎo)后繼續(xù)干活。這個(gè)策略叫 Advisor Strategy，工具叫 Advisor Tool

效果是：智能接近 Opus，成本接近 Sonnet

Advisor 策略的工作方式：Sonnet 執(zhí)行，遇到難題請教 Opus

反過來的 Sub-Agent 模式

行業(yè)里常見的多 Agent 模式是：大模型當(dāng)指揮官，拆解任務(wù)分給小模型去執(zhí)行。Advisor 策略把這個(gè)方向反過來了

Sonnet（或 Haiku）作為 Executor 全程執(zhí)行任務(wù)，調(diào)用工具、讀取結(jié)果、迭代推進(jìn)。當(dāng)它遇到一個(gè)自己判斷力不夠的決策點(diǎn)時(shí)，它會調(diào)用 Opus 作為 Advisor。Opus 拿到共享的上下文，返回一個(gè)計(jì)劃、一個(gè)糾正、或者一個(gè)停止信號。然后 Sonnet 繼續(xù)執(zhí)行

Advisor 不調(diào)用工具，不產(chǎn)出面向用戶的輸出，只提供指導(dǎo)。前沿級推理只在 Executor 需要的時(shí)候介入，其余時(shí)間全部按 Executor 的價(jià)格計(jì)費(fèi)

不是大模型指揮小模型干活，是小模型干活遇到難題請教大模型

這個(gè)設(shè)計(jì)的好處是：不需要任務(wù)拆解邏輯，不需要 worker pool，不需要編排框架。Executor 自己判斷什么時(shí)候需要升級，整個(gè)過程在一次 API 調(diào)用里完成

評測數(shù)據(jù)

先看 Sonnet + Opus Advisor 的組合

SWE-bench Multilingual

Sonnet + Advisor 比 Sonnet 單獨(dú)跑提升了 2.7 個(gè)百分點(diǎn)，同時(shí)每個(gè)任務(wù)的成本降低了 11.9%。成本降低的原因是 Advisor 的介入讓 Executor 少走彎路，減少了總 token 消耗

SWE-bench Multilingual：Sonnet + Advisor vs Sonnet Solo vs Opus Solo

BrowseComp 和 Terminal-Bench 2.0

在 BrowseComp 和 Terminal-Bench 2.0 上，Sonnet + Advisor 同樣超過了 Sonnet 單獨(dú)跑，而且每個(gè)任務(wù)的成本更低

BrowseComp + Terminal-Bench：Sonnet + Advisor 的表現(xiàn)和成本

再看 Haiku + Opus Advisor 的組合，這個(gè)更有趣

在 BrowseComp 上，Haiku + Advisor 得分 41.2%，是 Haiku 單獨(dú)跑（19.7%）的兩倍多。跟 Sonnet 單獨(dú)跑比，分?jǐn)?shù)低了 29%，但成本低了 85%

BrowseComp：Haiku + Advisor vs Haiku Solo vs Sonnet Solo

對于高吞吐、需要平衡智能和成本的場景，這個(gè)組合很有吸引力。用 Haiku 的價(jià)格拿到接近 Sonnet 水平的結(jié)果

怎么用

API 層面非常簡單。在 Messages API 請求的 tools 數(shù)組里加一個(gè) advisor_20260301 類型的工具，指定 Advisor 模型是 Opus，設(shè)一個(gè) max_uses 限制每次請求最多請教幾次

整個(gè)模型交接在一次 /v1/messages 請求里完成，不需要額外的網(wǎng)絡(luò)來回，不需要自己管理上下文傳遞。Executor 決定什么時(shí)候調(diào)用 Advisor，Anthropic 負(fù)責(zé)把精選的上下文路由給 Advisor 模型，拿到計(jì)劃后 Executor 繼續(xù)執(zhí)行

計(jì)費(fèi)方式：Advisor 的 token 按 Advisor 模型的價(jià)格算（Opus 的 $5/$25），Executor 的 token 按 Executor 模型的價(jià)格算（Sonnet 的 $3/$15 或 Haiku 的 $1/$5）。因?yàn)?Advisor 每次只生成一個(gè)短計(jì)劃（通常 400-700 個(gè) token），整體成本遠(yuǎn)低于全程跑 Opus

可以通過 max_uses 限制 Advisor 調(diào)用次數(shù)來控制成本。Advisor 的 token 消耗在 usage 中單獨(dú)報(bào)告

早期用戶怎么說

在復(fù)雜任務(wù)上做出了更好的架構(gòu)決策，在簡單任務(wù)上沒有任何額外開銷。計(jì)劃和執(zhí)行軌跡完全是兩個(gè)級別

Eric Simmons，Bolt CEO

我們看到了 Agent 輪次、工具調(diào)用次數(shù)和整體分?jǐn)?shù)的明確改善，比我們自己構(gòu)建的 planning 工具效果更好

Kay Zhu，Genspark 聯(lián)合創(chuàng)始人兼 CTO

在結(jié)構(gòu)化文檔提取任務(wù)上，Advisor 讓 Haiku 4.5 按需請教 Opus 4.6，達(dá)到了前沿模型的質(zhì)量，成本低 5 倍

Anuraj Pandey，Eve Legal 機(jī)器學(xué)習(xí)工程師

幾個(gè)信號

第一，這是 Anthropic 第一次在 API 層面提供模型間協(xié)作的原生支持。之前想讓 Sonnet 和 Opus 配合，你得自己寫編排邏輯、管理上下文傳遞、處理兩次 API 調(diào)用的狀態(tài)。現(xiàn)在一個(gè) tool 聲明就搞定

第二，定價(jià)邏輯很巧妙。Advisor 每次只輸出 400-700 個(gè) token 的短計(jì)劃，按 Opus 價(jià)格算也就幾分錢。但這幾分錢的指導(dǎo)可以讓 Executor 少走彎路，減少總 token 消耗。所以出現(xiàn)了「加了 Advisor 反而總成本更低」的現(xiàn)象

花幾分錢請教一次 Opus，省下來的是 Sonnet 走彎路燒掉的幾毛錢

第三，Haiku + Opus Advisor 的組合值得關(guān)注。BrowseComp 41.2% 的成績用 Haiku 的價(jià)格拿到，比 Sonnet 單獨(dú)跑便宜 85%。對于大規(guī)模、成本敏感的 Agent 部署場景，這個(gè)組合可能比 Sonnet 更合適

第四，時(shí)間線繼續(xù)加密。Mythos、Managed Agents、Advisor Tool，Anthropic 在一周內(nèi)連續(xù)發(fā)布了最強(qiáng)模型、Agent 基礎(chǔ)設(shè)施平臺、模型間協(xié)作工具，產(chǎn)品線的密度在快速增加

參考材料

The Advisor Strategy 官方博客
https://claude.com/blog/the-advisor-strategy

Advisor Tool API 文檔
https://platform.claude.com/docs/en/agents-and-tools/tool-use/advisor-tool

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.