<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      剛剛!Claude Opus 4.8 炸場,一夜升級成工作流AI

      0
      分享至

      千呼萬喚,Claude Opus 4.8 正式發布了。

      北京時間 5 月 29 日凌晨,Anthropic 正式發布 Claude Opus 4.8,如果只看名字,Opus 4.8 很容易被理解成 Opus 4.7 后面的一次小版本更新,其實從官方釋出的性能表來說,也確實如此。比如 Terminal-Bench 2.1 上,GPT-5.5 的 78.2% 仍然高于 Opus 4.8 的 74.6%。



      (圖源:Anthropic)

      不過,Anthropic 的真正殺招不只是 Claude Opus 4.8,而是隨這個新旗艦模型一同釋出,包括 Claude.ai 的 effort control、Claude Code 的 dynamic workflows 的全新Agent能力。

      事實上,Anthropic 已經不再執著于讓 Claude 變得更聰明了,而是選擇讓 Claude 變得更能干活了。

      判斷力是Opus 4.8 的最大突破

      我們先來看看 Anthropic 這款最新旗艦模型 Claude Opus 4.8 的具體性能。

      官方性能表里,Opus 4.8 在 Agentic Coding、Agentic Computer Use、Knowledge Work、Finance Agent 等多個項目上超過 Opus 4.7、GPT-5.5 和 Gemini 3.1 Pro。在 SWE-Bench Pro 上,Opus 4.8 是 69.2%,高于 Opus 4.7 的 64.3%;OSWorld-Verified 上,Opus 4.8 是 83.4%;GDPval-AA 上,Opus 4.8 得到 1890;Finance Agent v2 上,Opus 4.8 是 53.9%。



      (圖源:Anthropic)

      簡單來說,Opus 4.8 的核心升級是寫代碼、用終端、操作電腦、處理知識工作、做金融分析。更直白一點說,Opus 4.8 不是為“問答”而升級,而是為“代理執行”而升級。

      過去一年,大家對 coding agent 最大的不滿,并不是它完全不會寫代碼,而是它太自信了,比如你讓它跑一個任務,它會說任務完成了,但測試沒有真正跑通,還有它會把自己生成的代碼缺陷放過去,甚至用很篤定的語氣告訴你“一切正常”。換到問答里,那就是 AI 又一次“穩穩地接住了你”。

      這類問題對聊天產品來說只是體驗不太行,但對 agent 來說就是生產事故。

      因為 agent 的本質不是回答,而是行動。一個會行動的模型,最可怕的不是能力不足,而是能力不足卻不知道自己不足,所以 Opus 4.8 的提升點很重要,它更愿意指出不確定性,愿意在證據不足時停下來,等待你補充完整信息再去行動。官方甚至提到,Opus 4.8 讓代碼缺陷未經提醒通過的概率,比前代低了很多。

      從官方早測反饋看,Cursor、Devin、Databricks、法律 AI、金融分析、瀏覽器 agent 等合作方也提到:

      工具調用更干凈,任務推進更穩,長程上下文保持更好,更適合無人值守或半無人值守的復雜工作。

      另外,ClaudeDevs 官方賬號對 dynamic workflows 做了連續解釋:Claude Code 現在可以臨時寫 orchestration script,然后并行啟動大量 coordinated subagents 來處理復雜任務。官方還明確說,這類 workflow 適合 service-wide bug hunt、大型遷移、設計壓力測試這類單 agent loop 很難完成的任務。



      (圖源:Anthropic)

      Bun 作者 Jarred Sumner 表示, dynamic workflows 是目前可靠使用 agents 完成中大型項目的前沿方式之一,并提到 Bun 重寫為 Rust 的過程中,dynamic workflows 和 adversarial code review 起到了重要作用。

      不難看出,Opus 4.8 就不是一個單獨拎出來很強的模型,它更重要的是在 Claude Code 這套 agent 系統里的核心執行模型。

      與此同時,Anthropic 一同發布的幾個新能力也很有意思,比如Claude.ai 新增的 effort control ,用戶現在可以控制 Claude 在任務上“花多少力氣”,有幾個選項,低 effort 更快、更省;高 effort 更深、更適合復雜任務,Opus 4.8 默認的是 high effort,假如想要省一些 token,那最好手動切換回低 effort。

      5 月模型大混戰:全員加速 Agent

      整個 5 月,AI 圈幾乎是各家廠商各顯神通。

      OpenAI 繼續強化 Codex,展示用 Codex 構建自改進稅務智能體;Google 在 I/O 上發布一整套 AI agent 開發工具鏈;GitHub、Cursor、OpenAI 都在爭奪企業級 AI 編程代理的位置;Replit Agent 開始和自動化 QA 結合;Luma Agents 用于規模化生成真實 UGC 廣告;阿里云也在推 DataWorks AI 數據智能體和“全天候 AI 勞動力”。

      國內模型側也在繼續高頻迭代,比如Qwen3.7-Max 強調編程能力,智譜 GLM-5.1 高速版主打 API 速度,MiniCPM5-1B、BitCPM-CANN 繼續往端側、低比特、低成本方向推進,商湯和騰訊混元等也在快速更新迭代。

      與此同時,價格戰也在悄悄打響。

      DeepSeek 再次降價,小米 MiMo 大模型也以極低價格入場,表面上看,這是 API 報價競爭,但實際上還是為了 Agent,因為 Agent 實在是太吃 tokens 了。

      如果只是聊天,一次可能只消耗幾百到幾千 tokens,但 Agent 不一樣,它要讀上下文、拆任務、寫計劃、調用工具、執行代碼、檢查結果、修復錯誤,有時還要拉起多個 subagents 并行工作。Claude Code 的 dynamic workflows 就是典型例子,官方自己也提醒它 powerful but expensive,會快速消耗大量 tokens。

      所以,token 價格戰不只是為了讓聊天更便宜,而是為了讓 Agent 這種高消耗形態跑得起來。所以,就連 Anthropic 也不得不把 fast mode 的價格打到了前代的三分之一,來應對這樣的高消耗。



      (圖源:Anthropic)

      看起來,大家只是在按部就班更新模型,但似乎都遺漏了一點,那就是這些模型的核心已經不再是聊天,而是比誰更能進入真實工作流。

      過去的大模型競爭,主戰場是對話,誰回答得更自然,誰推理更強,誰上下文更長,誰模態更好,現在主戰場正在變成 agent。

      Agent 競爭的核心不是單次回答,而是連續執行,它要求模型會拆任務、會調用工具、會管理上下文、會處理權限、會控制成本、會復核輸出,還要能在復雜環境中長時間不跑偏。

      這也是為什么 Opus 4.8 的官方沒有強調對話能力,而是把重點放在 agentic coding、computer use、knowledge work、financial analysis。因為 Anthropic 很清楚,未來最值錢的模型調用,不一定發生在聊天窗口里,而是發生在 IDE、終端、瀏覽器、數據平臺、企業后臺和各種自動化流程里。



      (圖源:Anthropic)

      從這個角度看,dynamic workflows 可能比 Opus 4.8 本身更重要。因為它把 Claude Code 從“一個 AI 程序員”推向“一支 AI 工程隊”。過去你讓模型做任務,本質上是一個模型在一個上下文里循環。現在它開始能拆分任務、并行分配子代理、讓不同 agent 互相驗證,最后再匯總結果。

      綜合來看,5 月這場模型大混戰,不只是“模型更強了”,而是“模型正在被允許做更多事”。

      Claude 一夜蛻變成工作流系統

      Opus 4.8 雖然在定位上是 Cludue 的旗艦模型,但不會是一次“震撼全場”的模型發布。

      它更像 Anthropic 給市場遞出的一張路線圖,這張路線圖里,模型不能只追求更聰明,還要更穩;任務不能只完成一輪對話,還要能持續推進;AI 不能只給出答案,還要能解釋過程、復核結果、控制成本,并且把工作流沉淀下來。這些都是未來所有大模型都要關注的點。

      于是我們可以看到,Opus 4.8 負責把 Claude 的判斷力和長程執行能力往前推一步,effort control 讓用戶可以在質量、速度和成本之間主動調節,dynamic workflows 則把 Claude Code 從單個 coding agent,推向一個可以拆任務、調度 subagents、并行執行和復核結果的工程協作系統。

      Claude 正在變成什么呢?答案已經很明顯了,Claude 正在從一個聊天模型,變成一個工程協作系統。

      接下來,大模型公司的競爭也會越來越少停留在“誰更會說”,而是把目標放在更可靠地完成復雜任務、更便宜地支撐高頻調用,把模型、工具、工作流、安全和成本控制,真正打包成生產力系統。

      在這一方向上, Anthropic 已經交出了第一份答卷。

      Opus名字來自拉丁語中的“作品”,常用來形容一位作曲家的傳世之作(magnum opus,即“最偉大的作品”)。在古典音樂里,Opus 后面跟著編號,代表作曲家最重要的創作。貝多芬的《月光奏鳴曲》是 Op. 27,《命運交響曲》是 Op. 67。這不是隨便寫的東西,這是嘔心瀝血的集大成之作。

      從引領加速AI產業進入工作流時代的意義來看,Claude Opus 4.8確實堪稱一個傳世之作。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      蘇州一對情侶,談了7年,女子提了18次分手,分手后在街頭痛哭!

      蘇州一對情侶,談了7年,女子提了18次分手,分手后在街頭痛哭!

      川渝視覺
      2026-04-17 22:13:14
      夫妻一吃自己做的飯就拉肚子,吃外賣卻沒事,一年半還沒找到原因

      夫妻一吃自己做的飯就拉肚子,吃外賣卻沒事,一年半還沒找到原因

      夜深愛雜談
      2026-05-29 07:56:08
      雙管齊下!曼聯1.5億鎖中場雙星,紐卡飛翼+2英冠球員進引援名單

      雙管齊下!曼聯1.5億鎖中場雙星,紐卡飛翼+2英冠球員進引援名單

      體壇鑒春秋
      2026-05-29 12:35:53
      今天,你爺爺的爺爺都漲停了

      今天,你爺爺的爺爺都漲停了

      趨勢巡航
      2026-05-29 14:51:54
      譚松韻被曝離婚了!本人回應:的確是結了,但現在又離了,后來和好了

      譚松韻被曝離婚了!本人回應:的確是結了,但現在又離了,后來和好了

      八卦王者
      2026-05-29 11:25:44
      扎心!“小馬云”女友發聲,我就是想蹭流量,每次叫我姐姐發早安

      扎心!“小馬云”女友發聲,我就是想蹭流量,每次叫我姐姐發早安

      火山詩話
      2026-05-27 07:40:38
      湖北省供銷合作總社黨組書記、主任調整

      湖北省供銷合作總社黨組書記、主任調整

      娛樂圈的筆娛君
      2026-05-29 17:58:26
      莫言:如果你混到沒人找你吃飯,沒人喊你聚會,連電話也沒幾個,那慶祝了,你不是人緣變差,而是真正覺醒了

      莫言:如果你混到沒人找你吃飯,沒人喊你聚會,連電話也沒幾個,那慶祝了,你不是人緣變差,而是真正覺醒了

      品讀時刻
      2026-05-27 09:00:58
      國防部發言人回應網友“手搓”殲-35和殲-6亮相“東北超”

      國防部發言人回應網友“手搓”殲-35和殲-6亮相“東北超”

      大象新聞
      2026-05-29 08:24:07
      王晶點評《給阿嬤的情書》票房一飛沖天原因,內行果然一語中的!

      王晶點評《給阿嬤的情書》票房一飛沖天原因,內行果然一語中的!

      八卦南風
      2026-05-29 11:14:02
      她花50萬買英國精子生三胞胎,8年后三個娃長這樣,全網沉默

      她花50萬買英國精子生三胞胎,8年后三個娃長這樣,全網沉默

      吳蒂旅行ing
      2026-05-29 06:40:39
      馬斯克改口:Anthropic 租用 SpaceX 算力僅半年,必要時將收回

      馬斯克改口:Anthropic 租用 SpaceX 算力僅半年,必要時將收回

      環球網資訊
      2026-05-29 10:33:14
      歐洲多國使館力挺烏克蘭,拒絕撤離基輔,但澤連斯基想要更多

      歐洲多國使館力挺烏克蘭,拒絕撤離基輔,但澤連斯基想要更多

      共工之錨
      2026-05-29 20:31:49
      殯葬師提醒:守靈那一夜,家屬千萬別只顧著熬,一定守好這3件事

      殯葬師提醒:守靈那一夜,家屬千萬別只顧著熬,一定守好這3件事

      千秋歷史
      2026-05-26 19:31:00
      隨著廣東廣州豹0-0,寧波1-1,陜西0-1,中甲最新積分榜出爐

      隨著廣東廣州豹0-0,寧波1-1,陜西0-1,中甲最新積分榜出爐

      側身凌空斬
      2026-05-29 21:27:35
      有人預測:再過一兩個月,中國二手房或將面對這3個結局

      有人預測:再過一兩個月,中國二手房或將面對這3個結局

      童童聊娛樂啊
      2026-05-29 19:12:35
      “特變電工”潛力巨大!

      “特變電工”潛力巨大!

      木禾黑貓
      2026-05-29 21:37:41
      中方J-16戰機攜帶實彈驅趕荷艦機,30秒內可解決

      中方J-16戰機攜帶實彈驅趕荷艦機,30秒內可解決

      無意爭春
      2026-05-29 18:53:23
      第一批逃離高溫的人,已經在吉林住下了

      第一批逃離高溫的人,已經在吉林住下了

      聞旅派
      2026-05-28 20:04:13
      當你接觸的人多了,你會明白如果一個人還在穿5年前的衣服,只說明這幾個問題

      當你接觸的人多了,你會明白如果一個人還在穿5年前的衣服,只說明這幾個問題

      LULU生活家
      2026-05-29 19:07:23
      2026-05-29 22:35:00
      雷科技 incentive-icons
      雷科技
      專注AI硬科技
      36987文章數 812137關注度
      往期回顧 全部

      科技要聞

      Claude Opus 4.8凌晨突發上線

      頭條要聞

      疑第三方幫拉客宣傳"存1萬返100還報銷路費" 銀行回應

      頭條要聞

      疑第三方幫拉客宣傳"存1萬返100還報銷路費" 銀行回應

      體育要聞

      即使是文班亞馬,也做不到這件事

      娛樂要聞

      奚夢瑤何猷君將于6月在法國舉行婚禮

      財經要聞

      馬云密友"錢多多",深陷"殺豬盤"質疑

      汽車要聞

      900V+3.2秒破百 領克10+&領克10上市16.99萬元起

      態度原創

      旅游
      教育
      房產
      公開課
      軍事航空

      旅游要聞

      2026“國際山地旅游日”主題活動在湖北神農架啟幕

      教育要聞

      噓!中高考來了,全城禁噪聲

      房產要聞

      順德澐璟「澐冠」再出圈:頂階人群不是買房,是追加“傳世資產”

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      中方公布參加香會陣容 幾大議題受到關注

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 福利社试看一分钟| 国产360激情盗摄全集| 久久夜色精品国产网站| 国产日韩综合av在线| 极品美女一区二区三区| 国产无码swag专区| 韩国免费a级毛片久久| 欧美福利精品| 好吊色妇女免费视频免费 | 国产无遮挡免费真人视频在线观看| 中文字幕亚洲亚洲精品| AV制服丝袜白丝国产网站| 国产亚洲综合欧美视频| 午夜精品偷拍| 在线观看美女网站大全免费| 久久亚洲日韩精品一区二区三区| 18禁超污无遮挡无码网址| 成人无码区免费视频网站蜜臀 | 日韩女同一区二区三区久久| 国产欧美日韩一区二区三区在线 | 亚洲日韩国产二区无码| 漂亮人妻被中出中文字幕色| 成人免费AV一区二区三区| 美女黄色网| 99国精品午夜福利视频不卡99| 日韩无码一卡二卡| 99国精品午夜福利视频不卡99 | 中文字幕国产在线精品| 日韩人妻无码专区一| 国产99久久无码精品| 人妻斩0930无码视频| 巢湖市| 91资源总站| 免费中文熟妇在线影片| 中文字幕在线免费观看| 民宅夫妻偷拍啪啪55AV| 国产偷国产偷亚洲清高网站 | 成人国产精品一区二区网站公司| 中文字幕一区二| 大吊一区二区| 亚洲成a人片在线观看日本|