<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      Claude Code 的“/goals”將執行任務的代理與決定任務完成的代理區分開來。

      0
      分享至


      https://venturebeat.com/orchestration/claude-codes-goals-separates-the-agent-that-works-from-the-one-that-decides-its-done

      代碼遷移代理程序運行完畢,管道狀態顯示正常。但實際上有幾段代碼從未編譯完成——而且花了數天時間才發現這個問題。這不是模型故障;而是代理程序在實際完成之前就判定任務已完成。

      許多企業現在發現,生產環境中的AI代理流程失敗并非由于模型本身能力不足,而是因為代理背后的模型決定停止運行。LangChain、Google和OpenAI目前都提供了一些防止任務過早退出的方法,但這些方法通常依賴于獨立的評估系統。Anthropic公司在Claude Code上提出了最新的方法:/goals,該方法正式地將任務執行和任務評估分離。

      編碼代理以循環方式工作:它們讀取文件、運行命令、編輯代碼,然后檢查任務是否完成。

      Claude Code /goals 本質上是在該循環中添加了第二層。用戶定義目標后,Claude 會繼續逐輪執行,但每一步之后都會引入一個評估模型來審查并判斷目標是否已達成。

      兩種模型的劃分

      來自三家供應商的編排平臺都遇到了同樣的難題。但它們的解決方法卻不盡相同。OpenAI 不干預循環,讓模型自行決定何時結束,但允許用戶添加自己的評估節點。LangGraph 和 Google 的 Agent Development Kit 也支持獨立評估,但需要開發者定義評判節點、編寫終止邏輯并配置可觀測性。

      Claude Code 的 `/goals` 參數用于設置獨立評估器的默認運行時間,即用戶希望評估器運行更長時間還是更短時間。基本上,開發者通過提示設置目標完成條件。例如,`/goal all tests in test/auth pass and lint step is clean`。然后 Claude Code 運行,每次代理嘗試結束工作時,評估模型(默認為 Haiku)都會檢查條件循環。如果條件不滿足,代理將繼續運行。如果條件滿足,則會將已達成的條件記錄到代理對話記錄中,并清除目標。評估器只做兩個決定,這也是為什么無論目標是否完成,較小的 Haiku 模型都能很好地工作的原因。

      Claude Code 通過將嘗試完成任務的模型與確保任務實際完成的評估模型分離,實現了這一點。這可以防止智能體將已完成的任務與仍需完成的任務混淆。Anthropic 指出,使用這種方法,無需第三方可觀測性平臺(盡管企業可以繼續將第三方平臺與 Claude Code 結合使用),也無需自定義日志,并且減少了對事后重建的依賴。

      像 Google ADK 這樣的競爭對手支持類似的評估模式。Google ADK 部署了 LoopAgent,但開發者需要自行設計相關邏輯。

      人道組織在其文件中指出,最成功的條件通常具備以下特點:

      • 一個可衡量的最終狀態:測試結果、構建退出代碼、文件計數、空隊列

      • 明確說明檢查方式:Claude 應該如何證明,例如“npm test exits 0”或“git status is clean”。

      • 重要的約束條件:任何在此過程中絕對不能改變的內容,例如“不得修改其他測試文件”。

      在環可靠性

      對于已經管理龐大工具棧的企業來說,其吸引力在于它是一個原生評估器,不會增加需要維護的另一個系統。

      這是智能體領域更廣泛趨勢的一部分,尤其是在有狀態、長時間運行和自學習智能體的可能性日益成為現實的情況下。評估模型、驗證系統和其他獨立裁決系統開始出現在推理系統中,在某些情況下,也出現在像 Devin 或 SWE-agent 這樣的編碼智能體中。

      Sprinklr 的解決方案總監 Sean Brownell 在一封電子郵件中告訴 VentureBeat,人們對這種任務和評判者分離的循環很感興趣,但他認為 Anthropic 的方法并沒有什么獨特之處。

      “是的,這個循環有效。將構建者和評判者分開是合理的設計,因為從根本上講,你不能指望模型來評判它自己的作業。執行任務的模型往往最難判斷任務是否完成,”布朗內爾說道。“話雖如此,Anthropic 并非首家將此類技術推向市場的公司。這里最有趣的是,全球兩家最大的人工智能實驗室在短短幾天內發布了相同的指令,但它們對于誰有權宣布‘完成’卻得出了截然不同的結論。”

      布朗內爾表示,該循環最適用于“具有可驗證最終狀態的確定性工作,例如遷移、修復損壞的測試套件、清理積壓工作”,但對于更細致的任務或需要設計判斷的任務,由人來做決定則更為重要。

      將評估者/任務拆分到代理循環級別表明,像 Anthropic 這樣的公司正在推動代理和編排進一步朝著更可審計、可觀察的系統發展。

      閱讀最新前沿科技趨勢報告,請訪問21世紀關鍵技術研究院的“未來知識庫”


      未來知識庫是 “21世紀關鍵技術研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

      截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告

      (加入未來知識庫,全部資料免費閱讀和下載)

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      切爾西官宣阿隆索出任主帥 簽約四年

      切爾西官宣阿隆索出任主帥 簽約四年

      日常碎碎念啊
      2026-05-19 00:32:45
      太炸了!李冰冰戛納紅毯封神,53歲水墨高定禮服驚艷老外

      太炸了!李冰冰戛納紅毯封神,53歲水墨高定禮服驚艷老外

      調侃國際觀點
      2026-05-16 19:42:22
      企業拒聘女性是丑陋性別歧視

      企業拒聘女性是丑陋性別歧視

      烽火瞭望者
      2026-05-18 06:16:33
      AI“美女球迷”席卷網絡,真假難辨的賽場新亂象

      AI“美女球迷”席卷網絡,真假難辨的賽場新亂象

      樂道足球C
      2026-05-15 20:18:23
      徹底破防!反華十幾年的盧比奧訪華歸來:換我是中國也會這么干

      徹底破防!反華十幾年的盧比奧訪華歸來:換我是中國也會這么干

      行者聊官
      2026-05-18 17:21:40
      花生再次被關注!調查發現:糖尿病常吃花生不過半年或有4好處

      花生再次被關注!調查發現:糖尿病常吃花生不過半年或有4好處

      芹姐說生活
      2026-05-15 23:37:01
      董路是最大贏家!亞洲杯半決賽+直播時間:中國U17男足VS澳大利亞

      董路是最大贏家!亞洲杯半決賽+直播時間:中國U17男足VS澳大利亞

      開成運動會
      2026-05-17 23:18:24
      泡泡瑪特王寧母校獲贈20億Token,網友質疑僅值幾百元

      泡泡瑪特王寧母校獲贈20億Token,網友質疑僅值幾百元

      三言科技
      2026-05-18 09:27:36
      寧波男子被辭后瞞著家人,在車里住了7天,身無分文、陷入絕境向路口交警求助,最新:該男子已成功找到新工作

      寧波男子被辭后瞞著家人,在車里住了7天,身無分文、陷入絕境向路口交警求助,最新:該男子已成功找到新工作

      環球網資訊
      2026-05-18 18:13:52
      她與周星馳交往3年分手,成星爺唯一想娶的人,背后原因令人唏噓

      她與周星馳交往3年分手,成星爺唯一想娶的人,背后原因令人唏噓

      她時尚丫
      2026-05-19 00:01:53
      亡國滅種,斷子絕孫?歐洲反華先鋒立陶宛,正在從地圖上消失

      亡國滅種,斷子絕孫?歐洲反華先鋒立陶宛,正在從地圖上消失

      混沌錄
      2026-05-18 17:05:26
      王炸!湖北新添一家同濟醫院,總投資17.9億元,規劃床位1000張!

      王炸!湖北新添一家同濟醫院,總投資17.9億元,規劃床位1000張!

      越喬
      2026-05-18 14:31:05
      外交部發言人就第79屆世界衛生大會拒絕涉臺提案發表談話

      外交部發言人就第79屆世界衛生大會拒絕涉臺提案發表談話

      界面新聞
      2026-05-18 21:43:39
      去告別了?即將執教皇馬,穆里尼奧剛剛抵達本菲卡訓練基地

      去告別了?即將執教皇馬,穆里尼奧剛剛抵達本菲卡訓練基地

      懂球帝
      2026-05-18 18:29:10
      中南大學男生錄高考加油視頻,帥得被質疑是AI,本人回應:只是普通帥哥,目前單身,被要聯系方式出于禮貌都會同意

      中南大學男生錄高考加油視頻,帥得被質疑是AI,本人回應:只是普通帥哥,目前單身,被要聯系方式出于禮貌都會同意

      揚子晚報
      2026-05-16 08:47:38
      沖15億票房,張藝謀甘拜下風,吳京也攔不住,年中最強電影誕生了

      沖15億票房,張藝謀甘拜下風,吳京也攔不住,年中最強電影誕生了

      電影票房預告片
      2026-05-17 23:56:56
      賀希寧18分5助攻無濟于事,三細節說明他的MVP依然是徒有虛名

      賀希寧18分5助攻無濟于事,三細節說明他的MVP依然是徒有虛名

      姜大叔侃球
      2026-05-18 22:13:42
      WSBK執行總監:世界超級摩托車錦標賽進入中國進程或大大加快

      WSBK執行總監:世界超級摩托車錦標賽進入中國進程或大大加快

      IT之家
      2026-05-18 21:58:19
      人倫之亂,正在悄悄毀掉無數家庭!看完一身冷汗

      人倫之亂,正在悄悄毀掉無數家庭!看完一身冷汗

      三農老歷
      2026-05-08 19:20:12
      楊梅也雙標?出口按歐盟標準,內銷隨意泡藥水,曝光黑幕者遭威脅

      楊梅也雙標?出口按歐盟標準,內銷隨意泡藥水,曝光黑幕者遭威脅

      垛垛糖
      2026-05-17 14:11:26
      2026-05-19 01:03:00
      人工智能學家 incentive-icons
      人工智能學家
      人工智能領域權威媒體
      4744文章數 37464關注度
      往期回顧 全部

      科技要聞

      同一公司,有人獎金是6年工資,我卻只有半年

      頭條要聞

      賴清德要求美國繼續向臺出售武器 外交部表態

      頭條要聞

      賴清德要求美國繼續向臺出售武器 外交部表態

      體育要聞

      58順位的保羅,最強第三中鋒

      娛樂要聞

      票房會破14億!口碑第一電影出現了

      財經要聞

      中國芯片,怎么突然不便宜了?

      汽車要聞

      40.98萬起!充電5分鐘純電續航420km 騰勢N9閃充版勝算有多少?

      態度原創

      房產
      時尚
      家居
      本地
      數碼

      房產要聞

      突發!海口重磅調規!碧桂園要解套;新埠島要起飛了!

      夏天別總穿黑衣黑褲,這幾款格紋單品也很實用,百搭又高級

      家居要聞

      觀山隱秀 心靈沉淀

      本地新聞

      用蘇繡的方式,打開江西婺源

      數碼要聞

      索尼十周年紀念耳機The ColleXion曝光 設計全面奢華升級

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲精品一区二区18禁| 在线视频 亚洲精品| 精品3p| 美女色在线观看| 中国无码人妻丰满熟妇啪啪软件| 欧美 亚洲 国产 视频 小说| 国产天天操| 日韩国产精品中文字幕| 亚洲.无码.制服.日韩.中文字幕| 在线免费观看毛片av| 亚洲av成人精品综合| 亚洲一区二区三区成人网站| 国产精品v欧美精品∨日韩| 亚洲国产激情一区二区三区| 九九精品无码专区免费| 国产精品| Jizz国产一区二区| 国产精品中文字幕综合| 国产午夜精品在人线播放| 视频二区中文字幕在线| 美女视频在线永久免费观看| 国产人妻精品一区二区三区| 成人午夜视频福利| 亚洲中文字幕2025| 亚洲高潮喷水无码AV电影| 久久久久无码中| 国产午夜亚洲精品三区| 亚洲色日韩| 捆绑av一区二区三区| 少妇xxxxx性开放| 一区二区不卡国产精品| 日日碰狠狠躁久久躁96avv| 人妻无码视频一区二区三区| 久久久久久久97| 久久青草亚洲AV无码麻豆| 天堂mv在线mv免费mv香蕉| 国产成人欧美日韩在线电影| 精品久久精品午夜精品久久| 亚洲成A人V欧美综合天堂麻豆| 亚洲精品成人a?v| 超碰福利电影|