<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Anthropic 新工具:Sonnet 遇到難題可以請教 Opus 了

      0
      分享至

      PRODUCT

      Anthropic 發(fā)布了一個(gè)新的 API 工具,讓 Sonnet 或 Haiku 在跑任務(wù)的過程中,遇到搞不定的決策時(shí)自動請教 Opus,拿到指導(dǎo)后繼續(xù)干活。這個(gè)策略叫 Advisor Strategy,工具叫 Advisor Tool

      效果是:智能接近 Opus,成本接近 Sonnet


      Advisor 策略的工作方式:Sonnet 執(zhí)行,遇到難題請教 Opus

      反過來的 Sub-Agent 模式

      行業(yè)里常見的多 Agent 模式是:大模型當(dāng)指揮官,拆解任務(wù)分給小模型去執(zhí)行。Advisor 策略把這個(gè)方向反過來了

      Sonnet(或 Haiku)作為 Executor 全程執(zhí)行任務(wù),調(diào)用工具、讀取結(jié)果、迭代推進(jìn)。當(dāng)它遇到一個(gè)自己判斷力不夠的決策點(diǎn)時(shí),它會調(diào)用 Opus 作為 Advisor。Opus 拿到共享的上下文,返回一個(gè)計(jì)劃、一個(gè)糾正、或者一個(gè)停止信號。然后 Sonnet 繼續(xù)執(zhí)行

      Advisor 不調(diào)用工具,不產(chǎn)出面向用戶的輸出,只提供指導(dǎo)。前沿級推理只在 Executor 需要的時(shí)候介入,其余時(shí)間全部按 Executor 的價(jià)格計(jì)費(fèi)

      不是大模型指揮小模型干活,是小模型干活遇到難題請教大模型

      這個(gè)設(shè)計(jì)的好處是:不需要任務(wù)拆解邏輯,不需要 worker pool,不需要編排框架。Executor 自己判斷什么時(shí)候需要升級,整個(gè)過程在一次 API 調(diào)用里完成

      評測數(shù)據(jù)

      先看 Sonnet + Opus Advisor 的組合

      SWE-bench Multilingual

      Sonnet + Advisor 比 Sonnet 單獨(dú)跑提升了 2.7 個(gè)百分點(diǎn),同時(shí)每個(gè)任務(wù)的成本降低了 11.9%。成本降低的原因是 Advisor 的介入讓 Executor 少走彎路,減少了總 token 消耗


      SWE-bench Multilingual:Sonnet + Advisor vs Sonnet Solo vs Opus Solo

      BrowseComp 和 Terminal-Bench 2.0

      在 BrowseComp 和 Terminal-Bench 2.0 上,Sonnet + Advisor 同樣超過了 Sonnet 單獨(dú)跑,而且每個(gè)任務(wù)的成本更低


      BrowseComp + Terminal-Bench:Sonnet + Advisor 的表現(xiàn)和成本

      再看 Haiku + Opus Advisor 的組合,這個(gè)更有趣

      在 BrowseComp 上,Haiku + Advisor 得分 41.2%,是 Haiku 單獨(dú)跑(19.7%)的兩倍多。跟 Sonnet 單獨(dú)跑比,分?jǐn)?shù)低了 29%,但成本低了 85%


      BrowseComp:Haiku + Advisor vs Haiku Solo vs Sonnet Solo

      對于高吞吐、需要平衡智能和成本的場景,這個(gè)組合很有吸引力。用 Haiku 的價(jià)格拿到接近 Sonnet 水平的結(jié)果

      怎么用

      API 層面非常簡單。在 Messages API 請求的 tools 數(shù)組里加一個(gè) advisor_20260301 類型的工具,指定 Advisor 模型是 Opus,設(shè)一個(gè) max_uses 限制每次請求最多請教幾次

      整個(gè)模型交接在一次 /v1/messages 請求里完成,不需要額外的網(wǎng)絡(luò)來回,不需要自己管理上下文傳遞。Executor 決定什么時(shí)候調(diào)用 Advisor,Anthropic 負(fù)責(zé)把精選的上下文路由給 Advisor 模型,拿到計(jì)劃后 Executor 繼續(xù)執(zhí)行

      計(jì)費(fèi)方式:Advisor 的 token 按 Advisor 模型的價(jià)格算(Opus 的 $5/$25),Executor 的 token 按 Executor 模型的價(jià)格算(Sonnet 的 $3/$15 或 Haiku 的 $1/$5)。因?yàn)?Advisor 每次只生成一個(gè)短計(jì)劃(通常 400-700 個(gè) token),整體成本遠(yuǎn)低于全程跑 Opus

      可以通過 max_uses 限制 Advisor 調(diào)用次數(shù)來控制成本。Advisor 的 token 消耗在 usage 中單獨(dú)報(bào)告

      早期用戶怎么說

      在復(fù)雜任務(wù)上做出了更好的架構(gòu)決策,在簡單任務(wù)上沒有任何額外開銷。計(jì)劃和執(zhí)行軌跡完全是兩個(gè)級別

      Eric Simmons,Bolt CEO

      我們看到了 Agent 輪次、工具調(diào)用次數(shù)和整體分?jǐn)?shù)的明確改善,比我們自己構(gòu)建的 planning 工具效果更好

      Kay Zhu,Genspark 聯(lián)合創(chuàng)始人兼 CTO

      在結(jié)構(gòu)化文檔提取任務(wù)上,Advisor 讓 Haiku 4.5 按需請教 Opus 4.6,達(dá)到了前沿模型的質(zhì)量,成本低 5 倍

      Anuraj Pandey,Eve Legal 機(jī)器學(xué)習(xí)工程師

      幾個(gè)信號

      第一,這是 Anthropic 第一次在 API 層面提供模型間協(xié)作的原生支持。之前想讓 Sonnet 和 Opus 配合,你得自己寫編排邏輯、管理上下文傳遞、處理兩次 API 調(diào)用的狀態(tài)。現(xiàn)在一個(gè) tool 聲明就搞定

      第二,定價(jià)邏輯很巧妙。Advisor 每次只輸出 400-700 個(gè) token 的短計(jì)劃,按 Opus 價(jià)格算也就幾分錢。但這幾分錢的指導(dǎo)可以讓 Executor 少走彎路,減少總 token 消耗。所以出現(xiàn)了「加了 Advisor 反而總成本更低」的現(xiàn)象

      花幾分錢請教一次 Opus,省下來的是 Sonnet 走彎路燒掉的幾毛錢

      第三,Haiku + Opus Advisor 的組合值得關(guān)注。BrowseComp 41.2% 的成績用 Haiku 的價(jià)格拿到,比 Sonnet 單獨(dú)跑便宜 85%。對于大規(guī)模、成本敏感的 Agent 部署場景,這個(gè)組合可能比 Sonnet 更合適

      第四,時(shí)間線繼續(xù)加密。Mythos、Managed Agents、Advisor Tool,Anthropic 在一周內(nèi)連續(xù)發(fā)布了最強(qiáng)模型、Agent 基礎(chǔ)設(shè)施平臺、模型間協(xié)作工具,產(chǎn)品線的密度在快速增加

      參考材料

      The Advisor Strategy 官方博客
      https://claude.com/blog/the-advisor-strategy

      Advisor Tool API 文檔
      https://platform.claude.com/docs/en/agents-and-tools/tool-use/advisor-tool

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      男子16歲時(shí)便出軌嫂子,婚后瞞著妻子繼續(xù)出軌,還與嫂子生下一子

      男子16歲時(shí)便出軌嫂子,婚后瞞著妻子繼續(xù)出軌,還與嫂子生下一子

      老貓觀點(diǎn)
      2026-05-07 07:12:10
      廣東男籃大戰(zhàn)北京!球員半場評分:2人滿分、2人及格、3人崩盤

      廣東男籃大戰(zhàn)北京!球員半場評分:2人滿分、2人及格、3人崩盤

      林子說事
      2026-05-09 20:36:50
      文章面館爆火后再開酒吧!劉歡劉威到場祝賀,張若昀父親張健捧場

      文章面館爆火后再開酒吧!劉歡劉威到場祝賀,張若昀父親張健捧場

      露珠聊影視
      2026-05-09 21:24:29
      山東女孩放學(xué)回家路上失蹤,連續(xù)5天給母親托夢:我就在鍋里

      山東女孩放學(xué)回家路上失蹤,連續(xù)5天給母親托夢:我就在鍋里

      紙鳶奇譚
      2025-01-26 17:18:28
      華為Pura X Max這銷量,讓友商咋整?

      華為Pura X Max這銷量,讓友商咋整?

      數(shù)碼Antenna
      2026-05-09 12:35:49
      G2淘汰山東采訪!盧偉認(rèn)可全隊(duì)+調(diào)整外援狀態(tài),洛夫頓談自身發(fā)揮

      G2淘汰山東采訪!盧偉認(rèn)可全隊(duì)+調(diào)整外援狀態(tài),洛夫頓談自身發(fā)揮

      籃球資訊達(dá)人
      2026-05-09 23:41:07
      2026年強(qiáng)厄爾尼諾已就位!今年夏天,這四大風(fēng)險(xiǎn)每個(gè)人都躲不開

      2026年強(qiáng)厄爾尼諾已就位!今年夏天,這四大風(fēng)險(xiǎn)每個(gè)人都躲不開

      老特有話說
      2026-05-08 16:09:01
      影響力,梅西照片僅用五天成為F1賬號歷史點(diǎn)贊量最高的一條

      影響力,梅西照片僅用五天成為F1賬號歷史點(diǎn)贊量最高的一條

      懂球帝
      2026-05-09 13:12:06
      大快人心!山東女子網(wǎng)購榴蓮僅退款被拘留,村支書也說她是慣犯

      大快人心!山東女子網(wǎng)購榴蓮僅退款被拘留,村支書也說她是慣犯

      映射生活的身影
      2026-05-08 16:13:04
      紅場閱兵首現(xiàn)拒邀國,中方出席人選引關(guān)注,外交部明確回應(yīng)

      紅場閱兵首現(xiàn)拒邀國,中方出席人選引關(guān)注,外交部明確回應(yīng)

      諦聽骨語本尊
      2026-05-09 14:45:21
      威廉支持哈里離婚,只有離開吸血鬼梅根,弟弟才能回歸正常生活

      威廉支持哈里離婚,只有離開吸血鬼梅根,弟弟才能回歸正常生活

      紅袖說事
      2026-05-08 05:51:53
      于和偉越來越不對勁了,不是演技退步,而是整個(gè)人肉眼可見的變化

      于和偉越來越不對勁了,不是演技退步,而是整個(gè)人肉眼可見的變化

      喜歡歷史的阿繁
      2026-05-08 07:19:46
      劉德華一家三口回娘家,沒豪車沒保鏢,卻藏著最貴的豪門范兒

      劉德華一家三口回娘家,沒豪車沒保鏢,卻藏著最貴的豪門范兒

      木子娛你同行
      2026-05-09 13:00:03
      C919核心被卡,長江1000A批量安裝,2030年完全自主

      C919核心被卡,長江1000A批量安裝,2030年完全自主

      暖心萌阿菇?jīng)?/span>
      2026-05-10 00:00:22
      王平河系列:人不狠,站不穩(wěn)(8/9)

      王平河系列:人不狠,站不穩(wěn)(8/9)

      金昔說故事
      2026-05-10 00:03:07
      劉震云:當(dāng)你一無所有時(shí),死心塌地跟著你的女人,就是你的貴人

      劉震云:當(dāng)你一無所有時(shí),死心塌地跟著你的女人,就是你的貴人

      杏花煙雨江南的碧園
      2026-04-29 14:15:03
      段永平評OPPO母親節(jié)文案風(fēng)波:確實(shí)不合適,文案欠妥

      段永平評OPPO母親節(jié)文案風(fēng)波:確實(shí)不合適,文案欠妥

      南方都市報(bào)
      2026-05-09 22:04:09
      美軍空襲伊朗設(shè)施

      美軍空襲伊朗設(shè)施

      中國北方
      2026-05-08 21:50:45
      廣西一小區(qū)門口路面突然塌陷,女業(yè)主連人帶車掉進(jìn)坑受傷;目擊者:塌陷時(shí)我剛把孩子從那個(gè)地方抱開十來秒

      廣西一小區(qū)門口路面突然塌陷,女業(yè)主連人帶車掉進(jìn)坑受傷;目擊者:塌陷時(shí)我剛把孩子從那個(gè)地方抱開十來秒

      大風(fēng)新聞
      2026-05-09 18:44:08
      總結(jié)了一些鍛煉“大腦前額葉”的小方法,孩子真的越來越聰明了!

      總結(jié)了一些鍛煉“大腦前額葉”的小方法,孩子真的越來越聰明了!

      蓁蓁心理撫養(yǎng)
      2026-05-06 12:00:08
      2026-05-10 01:12:49
      賽博禪心
      賽博禪心
      拜AI古佛,修賽博禪心
      429文章數(shù) 53關(guān)注度
      往期回顧 全部

      科技要聞

      美國政府強(qiáng)力下場 蘋果英特爾達(dá)成代工協(xié)議

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現(xiàn)身

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現(xiàn)身

      體育要聞

      成立128年后,這支升班馬首奪頂級聯(lián)賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認(rèn)不出!

      財(cái)經(jīng)要聞

      多地號召,公職人員帶頭繳納物業(yè)費(fèi)

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態(tài)度原創(chuàng)

      房產(chǎn)
      健康
      游戲
      藝術(shù)
      軍事航空

      房產(chǎn)要聞

      低價(jià)甩賣!海口這個(gè)地標(biāo)商業(yè),無人接盤!

      干細(xì)胞能讓人“返老還童”嗎

      Windows 11 PC上的Xbox模式不支持多顯示器

      藝術(shù)要聞

      深圳終究失去“中國第一高樓”,華潤接手地塊!

      軍事要聞

      美伊突然再次交火 伊朗外長:戰(zhàn)爭準(zhǔn)備程度是1000%

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产av一区二区亚洲| 亚州中文字幕一区二区| 亚洲AV成人无码久久精品色欲| 国产 在线播放无码不卡| 日本高清视频色欧WWW| 国产美女一区二区| 亚洲精品系列| 精品少妇人妻av免费久久洗澡| 97夜夜澡人人爽人人模人人喊| 日韩久久中文字幕| 欧美色A?V| 奇米在线777在线精品视频| 国产伦码精品一区二区| 亚洲熟女精品一区二区| 日韩av在线不卡一区二区三区| 免费国产白丝喷水娇喘视频| 日韩欧美在线综合网另类| 日韩高清亚洲日韩精品一区二区| 狠狠躁天天躁中文字幕| 久久久久亚洲AV片无码下载蜜桃| 欧美xxxx黑人又粗又大| 亚洲精品日本久久久中文字幕 | 久久ER热在这里只有精品66| 精品无码一区二区三区电影| 麻豆人妻换人妻好紧| 欧美裸体xxxx极品| 第一区a| 九九热精品免费视频| 97aVaV| 精品一区二区三区在线视频观看 | 日韩精品人妻系列无码av东京| 国产粗大| 真实单亲乱l仑对白视频| 欧美高清性| 无码成a毛片免费| 色欲AV无码一区二区人妻| 人妻精品久久久久中文字幕69| 无码超乳爆乳中文字幕久久 | 3d动漫精品啪啪一区二区下载| 天天做天天爱天天做| 四川丰满少妇无套内谢|