<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      Mythos造假/Opus降智/Agent新平臺,Anthropic所有更新一次性看懂

      0
      分享至

      Anthropic這段時間的更新太多太零碎了,

      而且還被抓包那個藏起來不讓我們用新模型Claude Mythos效果作假,把Opus 4.6降智降到比4.5還差,思考長度從2200token壓縮到600token了,美其名曰優化延遲和token效率,新版本的Claude Code的緩存失效把我token消耗速度干到原來的10倍以上了。

      是時候來一個大掃除式的更新整理了!


      先用一個時間軸整理一下這段時間Anthropic的更新和大烏龍們,

      3月26號,大漏勺Anthropic內部CMS配置錯誤,3000個未發布的文檔泄漏了,里面就有Claude Mythos。

      3月31號,把Claude Code源碼泄漏了。

      4月4號,Anthropic限制了第三方工具用Claude 訂閱(OpenClaw史詩級削弱),只能用API,很狗的是還會識別當前Agent的System Prompt,有OpenClaw關鍵詞就給你ban了。

      4月6號,Claude Code新增了/ultraplan命令,一句話就是說把規劃任務從本地搬到云端的Claude Code Web,在瀏覽器端用Opus 4.6+Plan Mode生成計劃,review完可以選擇云端or本地執行。

      4月7號,Claude Mythos Preview發布 + Project Glasswing 網絡安全計劃啟動,還發布了244頁的報告。Mythos最出圈的就是發現了我們過去主流操作系統,軟件,瀏覽器里幾千個之前沒被發現的漏洞。當時我的想法是年底要是能用上Mythos我將直接起飛。

      4月8號,Claude Managed Agents發布,本質上是Anthropic的云端Agent平臺,核心賣點是一套調優過的Agent Harness(編排引擎),把Agent運行,工具調用,長時間運行等全部打包成開箱即用的云服務。Anthropic的API團隊還額外說明了Agent是怎么通過Vaults(憑證)來管理用戶訪問外部服務的密鑰,這個憑證不會被讀入Claude的上下文。

      platform.claude.com/docs/en/managed-agents/vaults

      4月9號,推出了Advisor Strategy(策略)與 Advisor Tool(工具),就是讓Sonnet/Haiku這兩個模型有不懂了就直接去問老大哥Opus,花Sonnet的錢實現Opus的表現

      4月10號OpenClaw的老父親Peter Steinberger的Claude賬戶被封了,幾小時又被光速恢復了,很難不懷疑是因為他入職了OpenAI的原因了(/此處有笑臉)

      還有一個超前預告,月底30號,Sonnet 4.5和4的百萬上下文窗口也會下線了。

      這段時間OpenAI在干什么呢?

      奧特曼不語,只是每新增100萬個用戶,就把Codex的額度重置一次,現在雙倍額度已經重置到了5月31號了。


      說那么多,是時候來分析一下Anthropic主動被動更新那么多東西意味著什么了,

      信號一|從賣模型到賣AI的基礎設施

      按照常規劇本,Anthropic應該直接公布Mythos的跑分,開放API,然后看著它在各種排行榜上屠榜。

      但他們沒有。

      他們選擇了一條強到不能公開的路線,對外說是Mythos在過去幾周里,發現了數千個潛伏多年的漏洞,像OpenBSD操作系統里還有一個藏了27年的骨灰級漏洞。然后,他們宣布,這個模型太危險了,不能公開發布,只能交給AWS,蘋果,谷歌這些巨頭,以及四十多家有關鍵基礎設施組織,在一個叫Project Glasswing(玻璃翼計劃)的項目里,專門用來做網絡安全防御。

      但是,看多了Anthropic更新,就會發現它每一次新模型都會發一點跟安全相關的新詞,ASL-4,Sleeper Agents,Undercover Mode,神經網絡暗物質,戰略性裝傻。

      這小詞一套又一套的。

      所以后面被研究員復測發現,Mythos的成果,很多都存在于老舊軟件里,隔壁GPT-OSS-20b照樣可以發現OpenBSD的漏洞。因為之前大模型的測試里比較少有大范圍測試過這些漏洞,反而被Mythos撿了個漏。

      Mythos的發布,本身就是一個信號。

      Anthropic想傳遞的,不只是技術參數,而是一種定價權和生態控制的聲明。

      他們不再滿足于賣給我們更鋒利的劍(大模型),他們現在還要賣能讓我們安全揮舞這把劍的劍鞘和訓練場,也就是他們緊接著推出的Claude Managed Agents。

      一個能直接在Anthrocip云端構建,托管和運行生產級AI代理的基礎設施,提供了沙盒,憑證管理,長時間運行會話這些過去需要我們費勁去搭的東西。

      這樣商業閉環就成了。

      先用Mythos來定義什么是頂級智能。然后再限制其他方(特指OpenClaw)用Claude額度。再然后,再用一個開箱即用的Managed Agents平臺告訴大家,想用好這種級別的智能,來我這里,我這兒有最安全,最方便的基礎設施。

      從模型提供商到Agent基礎設施提供商是一個定位轉移。

      而且盲猜未來很長一段時間安全仍是Anthropic的主線,會繼續推Trustworthy Agents框架,避免Mythos模型能力失控。


      Mythos和GPT 5.4 Pro的得分PK

      信號二|從大模型帶小弟到小弟請教大哥

      Anthropic新出的Advisor Strategy(顧問策略)也同樣有意思。

      過去我們做多Agent協作,常見的思路是,讓一個最強的大模型,比如Opus,當總指揮,把任務拆解了,分給一堆能力稍弱但便宜的小模型,比如Sonnet或者Haiku,去當執行者。

      這個模式的問題在于,總指揮需要很強的任務拆解能力,而且可以我們要自己搭一套復雜的編排框架。

      Advisor策略把這個思路完全反了過來。

      它讓Sonnet或者Haiku作為主力模型,全程跑任務,調用工具,推進工作。

      只有當它自己跑到某個坎,覺得腦子不夠用了,決策不了的時候,它才會主動搖人,調用一次Opus來當顧問。Opus拿到共享的上下文后,會快速給出一個戰略指導,然后立刻下線,Sonnet往下執行。


      這用的歸藏佬的圖

      這意味著,

      前沿的推理能力,只在需要的時候才介入。

      我們花的大部分錢,都是Sonnet或者Haiku的底價執行算力。而在抉擇的時候給我指路的是最聰明的Opus大哥。

      不過目前來說在Claude Code還用不了,要在API請求的時候顯式配置上這個Tool才行。

      platform.claude.com/docs/en/agents-and-tools/tool-use/advisor-tool

      也就是說,Anthropic正在把模型間的協作,

      從一個需要開發者額外配置的應用層問題,

      變成一個平臺原生支持的基礎能力。

      總的來說,

      Anthropic正在收緊它對生態的控制。

      想要提前結束這個允許我們用各種野生方式,

      去探索模型能力的大航海時代。

      他們現在希望所有的玩家,

      都能到他們預先規劃好的航道里來。

      順帶提一嘴,

      他們還發布了244頁的Mythos模型的心理評估,得到的結論是這模型是健康的神經病,

      就,怎么說呢,

      很符合我對Dario Amodei(Anthropic CEO)的刻板印象。

      @ 作者 / 卡爾

      最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點贊|在看|轉發|評論

      如果想要第一時間收到推送,不妨給我個星標

      如果你有更有趣的玩法,歡迎在評論區聊聊

      更多的內容正在不斷填坑中……


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      顧客入住一全季酒店,浴巾架有不明內褲,酒店回應:確實存在客房疏忽

      顧客入住一全季酒店,浴巾架有不明內褲,酒店回應:確實存在客房疏忽

      山西經濟日報
      2026-05-15 11:20:34
      中美關系,有了新定位

      中美關系,有了新定位

      中國新聞周刊
      2026-05-14 16:01:38
      A股:不用再等下周一行情,市場趨勢有變化,接下來很可能這樣走

      A股:不用再等下周一行情,市場趨勢有變化,接下來很可能這樣走

      財經大拿
      2026-05-15 11:55:57
      許利民:上海25連勝不是平白無故 今晚在強大的對手前敢于超越自我

      許利民:上海25連勝不是平白無故 今晚在強大的對手前敢于超越自我

      狼叔評論
      2026-05-15 12:46:21
      日航司高度焦慮!7月起,日本過華領空成本劇增,交錢也未必能批

      日航司高度焦慮!7月起,日本過華領空成本劇增,交錢也未必能批

      鐵錘簡科
      2026-05-14 13:24:35
      李善長問劉伯溫:朱元璋稱帝前會先殺誰?劉伯溫直接說了3個字

      李善長問劉伯溫:朱元璋稱帝前會先殺誰?劉伯溫直接說了3個字

      掠影后有感
      2026-05-15 11:09:15
      馬克龍在非洲的“傲慢秀”,換來的只有全場沉默

      馬克龍在非洲的“傲慢秀”,換來的只有全場沉默

      浪子的煙火人間
      2026-05-15 13:01:43
      曹德旺沒想到,兒子平穩接班才半年,女兒憑一個舉動再次給他長臉

      曹德旺沒想到,兒子平穩接班才半年,女兒憑一個舉動再次給他長臉

      好賢觀史記
      2026-05-11 15:06:08
      寶媽哭訴:脫褲子那一刻就沒了尊嚴!生娃七個尷尬瞬間,你中幾個

      寶媽哭訴:脫褲子那一刻就沒了尊嚴!生娃七個尷尬瞬間,你中幾個

      菁媽育兒
      2026-04-04 21:42:23
      首飛成功!已突破大重量載荷發射能力

      首飛成功!已突破大重量載荷發射能力

      揚子晚報
      2026-05-14 15:17:09
      變天了!會談后中方表態突然改了!特朗普訪華,真正底牌曝光

      變天了!會談后中方表態突然改了!特朗普訪華,真正底牌曝光

      星Xin辰大海
      2026-05-15 12:06:12
      “從短視頻刷出來的女主角”:零表演經驗、還是大二學生的她,怎樣成了《給阿嬤的情書》里的“南枝”?

      “從短視頻刷出來的女主角”:零表演經驗、還是大二學生的她,怎樣成了《給阿嬤的情書》里的“南枝”?

      新京報
      2026-05-14 12:25:56
      國乒動態:王楚欽身著西裝如貴公子,王皓攜妻參加活動年輕十歲

      國乒動態:王楚欽身著西裝如貴公子,王皓攜妻參加活動年輕十歲

      湘楚風云聊體育
      2026-05-15 00:25:07
      山西動物園全員午睡,游客:根本叫不醒

      山西動物園全員午睡,游客:根本叫不醒

      宇宙來信發
      2026-05-13 22:05:12
      參議院槍聲四起,馬科斯家族進退兩難,菲律賓政壇迎來重大變局

      參議院槍聲四起,馬科斯家族進退兩難,菲律賓政壇迎來重大變局

      呼呼歷史論
      2026-05-15 14:44:27
      三好老師的大長腿,夠你義務教育9年!

      三好老師的大長腿,夠你義務教育9年!

      貴圈真亂
      2026-05-15 11:17:56
      特朗普訪華,印度坐不住了!擔憂中美組成“G2”,莫迪搬救兵?

      特朗普訪華,印度坐不住了!擔憂中美組成“G2”,莫迪搬救兵?

      漫川舟船
      2026-05-15 15:38:55
      馬斯克瘋狂著迷的女人,艾梅柏帶3個娃隱居西班牙,孩子生父成謎

      馬斯克瘋狂著迷的女人,艾梅柏帶3個娃隱居西班牙,孩子生父成謎

      照見古今
      2026-04-29 16:00:06
      特朗普來華,外交學院專家臉被打腫了

      特朗普來華,外交學院專家臉被打腫了

      吃瓜體
      2026-05-14 13:37:12
      特朗普訪華隨行陣容受關注,駐華大使龐德偉緊隨身邊引矚目。

      特朗普訪華隨行陣容受關注,駐華大使龐德偉緊隨身邊引矚目。

      記錄生活日常阿蜴
      2026-05-15 15:01:15
      2026-05-15 16:15:00
      卡爾的AI沃茨 incentive-icons
      卡爾的AI沃茨
      前大廠算法工程師,3家科技公司技術總監|致力打造最系統的Al學習體系,讓1萬人通過Al提高生產力
      263文章數 134關注度
      往期回顧 全部

      科技要聞

      兩年聯姻一地雞毛,傳蘋果OpenAI瀕臨決裂

      頭條要聞

      女游客以1分錢拍下標價1980元的三亞海景房 酒店回應

      頭條要聞

      女游客以1分錢拍下標價1980元的三亞海景房 酒店回應

      體育要聞

      德約科維奇買的球隊,從第6級聯賽升入法甲

      娛樂要聞

      方媛為何要來《桃花塢6》沒苦硬吃?

      財經要聞

      特朗普的北京時刻

      汽車要聞

      雙零重力座椅/AI智能體/調光天幕 啟境GT7內飾發布

      態度原創

      健康
      教育
      時尚
      手機
      本地

      專家揭秘干細胞回輸的安全風險

      教育要聞

      新華讀報|拋繡球、游泳進中考,體育改革讓學生“玩有所得”

      56歲逆風翻盤,她怎么從全網群嘲變成了大家的天才女友?

      手機要聞

      史上最低價!iPhone 17 Pro系列京東天貓大促,全系優惠拉滿

      本地新聞

      用蘇繡的方式,打開江西婺源

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产香蕉精品视频一区二区三区 | 国产普通话一级毛片| 欧美三级中文字幕在线观看| 亚洲中文字幕日韩精品| 玖玖一区| 国产乱人伦AV在线A| 久久夜色噜噜噜亚洲av| 亚洲色图第一页| 六月丁香五月婷婷| 大陆一区视频观看| 人妻少妇久久久久久97人妻| 国产98在线| av天堂最新版在线| 久久国产精品成人免费古装| 国产一区二三区日韩精品| 欧美日韩精品福利在线观看| 国偷自产一区二区免费视频| 毛片av在线尤物一区二区| 免费看一区二区三区四区| 久久久全国免费视频| 无码国产精品一区二区免费式芒果| 97超级碰碰碰久久久久| 国产喷水1区2区3区咪咪爱av| 国产欧美亚洲精品a| 富婆熟妇熟女二区三区| av一本久道久久综合久久鬼色| 美女内射毛片在线看3d| 亚洲AV无码日韩一区二区乱| 人成午夜免费视频在线观看| 奇米四色7777中文字幕| 色综合激情丁香七月色综合| 香蕉亚洲欧洲在线一区| 日韩有码精品中文字幕| 国产成人精品一区二区三区免费 | 黄色三级小说| 亚洲成年人福利专区| 国产精品老熟女乱一区二区| 3P无码| 蜜桃伦理一区二区三区| 婷婷久久综合九色综合97| 在线看高清中文字幕一区|