<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      Claude Opus 4.7 發布,全網最詳細解讀

      0
      分享至

      PRODUCT

      我把手上幾個活都換到 4.7 試了試,比 4.6 好用太多,斷檔的強

      剛剛,Anthropic 發布 Claude Opus 4.7,已經在 Claude 的所有產品、API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry 上全面可用。模型 id claude-opus-4-7


      這是 Opus 4.6 的直接升級版。三條主線:編程能力在最難的任務上明顯提升、視覺分辨率擴大到過去的三倍多、同時是 Project Glasswing 之后第一個試驗新網絡安全護欄的對外模型

      定價完全不變,$5/M 輸入 token,$25/M 輸出 token。相比之下 Mythos Preview 的 API 價格是 $25/$125 per million,Opus 4.7 便宜 5 倍

      Anthropic 官方給出的總體對比圖,Opus 4.7 在多個基準上高于 Opus 4.6,但仍然弱于內部的 Mythos Preview


      Opus 4.7 / Opus 4.6 / GPT-5.4 / Gemini 3.1 Pro / Mythos Preview 橫向對比

      編程是主升級點

      Opus 4.7 最顯眼的變化在高難度軟件工程任務上。用戶反饋里反復出現兩個詞:長程自主

      過去必須盯著改的那類代碼活,現在可以放手讓它跑

      28 家早期客戶給了反饋,這里挑最硬核的幾個數據點

      GitHub:93 個任務的編程基準上,比 Opus 4.6 高 13%,4 個任務是 Opus 4.6 和 Sonnet 4.6 都搞不定的

      Cursor:CursorBench 過 70%,Opus 4.6 是 58%

      Rakuten:Rakuten-SWE-Bench 上解決的生產任務是 Opus 4.6 的 3 倍

      Hex:低 effort 檔的 Opus 4.7 大致等于中 effort 檔的 Opus 4.6

      Notion:準確率提升 14%,token 用得更少,工具調用錯誤減少到 三分之一。第一個通過 Notion 「隱含需求」測試的模型

      Cognition(Devin 的公司):能連貫工作幾個小時,不會卡在難題上放棄

      Replit、Vercel、Databricks、Warp、Factory、Ramp、CodeRabbit、Qodo、Bolt 等一系列廠商都給出了正面反饋。公告里一個反復出現的觀察是:Opus 4.7 減少了無意義的包裝函數和兜底腳手架,寫的時候自己發現問題自己改

      XBOW 的視覺敏銳度基準:Opus 4.6 是 54.5%,Opus 4.7 是 98.5%

      XBOW 做自動化滲透測試,這是這次發布里最硬的一個數據跳變

      Imbue 的案例最極端:Opus 4.7 自主從零構建了一個完整的 Rust TTS 引擎,包括神經網絡模型、SIMD 內核、瀏覽器 demo,然后用語音識別器反過來驗證自己的輸出是否匹配 Python 參考實現。代碼庫公開

      官方給出的編程基準圖


      編程基準橫掃

      視覺能力是第二大升級

      Opus 4.7 能接受的圖片長邊從之前的水平上升到 2,576 像素(約 3.75 兆像素),是此前 Claude 模型的三倍多

      這個能力是模型層的變化,沒有 API 參數開關。直接送圖過去就行,需要更高分辨率就不要自己壓縮

      順便把 Anthropic 的 Vision 文檔看一下,背景信息在這里:用 base64 或 URL 喂圖,單次請求最多可以傳 600 張(API)或 20 張(claude.ai)。上傳太大(單邊超過 1568 像素或超過約 1600 token 的圖)會先被服務端 down-sample。計價按 tokens ≈ (width × height) / 750 估算,1 兆像素大約 1334 tokens

      能用得上的場景:computer-use agent 讀密集截圖、復雜圖表里的數據抽取、需要像素級對照的工作。XBOW 的數據說明這個升級對 computer-use 是實質的


      視覺理解、OCR、計算機使用、圖表閱讀多項基準

      安全策略:Mythos 還沒放,先用 Opus 4.7 練手

      這次的安全設計要配合 Project Glasswing 一起看

      上周 Anthropic 聯合 AWS、蘋果、博通、思科、CrowdStrike、Google、摩根大通、Linux 基金會、微軟、NVIDIA、Palo Alto Networks 成立了 Project Glasswing。起因是 Anthropic 訓出了 Claude Mythos Preview 這個沒發布的前沿模型,在挖漏洞方面達到了超過大多數安全專家的水平

      Mythos Preview 過去幾周已經在每一個主流操作系統和主流瀏覽器里都找出了 0-day 漏洞。有三個公開案例:

      → OpenBSD 上存活了 27 年 的漏洞,攻擊者可以只靠連接就遠程崩掉任何一臺機器

      → FFmpeg 里的 16 年老洞,自動化測試工具跑過同一行代碼五百萬次都沒發現

      → Linux 內核里自主鏈起了幾個漏洞,把普通用戶權限升到完全控制

      Anthropic 的結論是,前沿 AI 在代碼漏洞發現和利用上已經進入可以比肩頂級安全專家的階段。如果護欄跟不上,這種能力一旦擴散會非常危險

      Opus 4.7 就是為這個問題準備的第一個對外模型。訓練過程中差異性地降低了網絡安全能力,發布時帶上了自動檢測和攔截高風險網絡安全用途請求的護欄。做合法用途的安全研究員(漏洞研究、滲透測試、紅隊)可以申請加入 Cyber Verification Program

      Mythos Preview 不會廣泛發布,Anthropic 給 Glasswing 參與方承諾了最高一億美元的使用額度。它的 API 價格是 $25/$125 每百萬 token,是 Opus 4.7 的 5 倍

      Opus 4.7 在網絡安全能力上弱于 Mythos Preview(訓練時就是這么設計的)。這些現實部署數據里學到的護欄經驗,會用來為后面更大范圍放 Mythos 級模型做準備

      對齊評估的總體結論:Opus 4.7 比 Opus 4.6 和 Sonnet 4.6 好一些,但 Mythos Preview 仍然是 Anthropic 訓出來的對齊最好的模型

      官方原話是 largely well-aligned and trustworthy, though not fully ideal in its behavior


      對齊評估總分,越低越好

      誠實度、抗 prompt injection 上 Opus 4.7 有改進。受控物質減害建議過于詳細這類問題上有小幅倒退。完整評估在 Claude Opus 4.7 System Card 里

      同步發布的東西

      除了模型本身,這次還有幾項更新

      新的 effort 檔位 xhigh。原來的檔位是 low / medium / high / max,這次在 highmax 中間插了一個 xhigh


      effort 檔位示意,xhigh 是這次新增

      這個參數控制的是 Claude 響應的 token 花費規模,覆蓋文字回答、工具調用、extended thinking 全部。Claude Code 里默認 effort 已經拉到 xhigh。官方建議編程和 agentic 場景用 highxhigh 起步

      task budgets 公測。API 端新功能,讓開發者能給 Claude 設置 token 預算,讓它在長任務里自己分配優先級。和 effort 參數一起用更細

      /ultrareview slash 命令。Claude Code 里新增,專門跑一個獨立的 review 會話,把改動從頭到尾過一遍,找 bug 和設計問題。Pro 和 Max 用戶有 3 次免費額度

      Auto mode 下放到 Max 用戶。3 月 24 日 Anthropic 先在 Team 計劃上發布了這個模式。機制是在 --dangerously-skip-permissions 和默認每步都問的兩極之間加了一個中間檔:每次工具調用前有個分類器檢查是否有危險操作(批量刪文件、敏感數據外泄、惡意代碼執行),安全的直接放行,危險的攔下來讓 Claude 換方案。這次 Max 用戶也能用

      遷移:兩個變化影響 token 消耗

      從 Opus 4.6 升 Opus 4.7 是直接替換,但有兩個點值得提前規劃

      第一:tokenizer 換了,文本處理方式更好了。代價是同樣的輸入文本,新 tokenizer 下的 token 數大約是舊版的 1.0–1.35 倍,取決于內容類型

      第二:高 effort 檔位下 Opus 4.7 想得更多,尤其是 agentic 場景里靠后的輪次。這帶來更高的硬題可靠性,但也意味著更多的輸出 token

      控制 token 使用的方法:調 effort、調 task budgets、提示模型更簡潔。Anthropic 自己的內部編程評估上,整體是 token 效率改善的,不同 effort 檔位都更優,但他們建議用戶在真實流量上自己量


      內部編程評估里,不同 effort 檔位都更優

      還有一個容易踩的坑:指令跟隨強度大幅提升

      意思是,為老模型寫的 prompt 有可能在 Opus 4.7 上產生意料之外的結果。過去 Claude 會寬松解讀或者跳過的指令,Opus 4.7 會嚴格按字面執行。升級的時候,prompt 和 harness 要重新調

      Anthropic 的遷移指南里還有一條老賬:用 Claude 4.6 或以上模型,thinking: {type: "enabled", budget_tokens: N} 已經 deprecated,推薦遷到 thinking: {type: "adaptive"}effort 參數。老的 beta header(effort-2025-11-24fine-grained-tool-streaming-2025-05-14interleaved-thinking-2025-05-14)也該刪掉了,這些功能都已經正式上線

      真實工作

      除了跑分,Anthropic 內部測試里 Opus 4.7 在金融分析師任務上比 Opus 4.6 更有效:更嚴謹的分析和建模、更專業的演示、任務之間的銜接更緊

      在第三方評估 GDPval-AA 上,Opus 4.7 拿到 state-of-the-art。這個評估是 Artificial Analysis 基于 OpenAI 的 GDPval 數據集做的,覆蓋 44 個職業、9 大行業的 220 個真實經濟價值任務。模型需要產出文檔、幻燈片、圖表、電子表格等實際工作交付物

      在 Opus 4.7 之前的榜單上,前三是 GPT-5.4 xhigh(ELO 1677)、Claude Sonnet 4.6 Max(1654)、Claude Opus 4.6 Max(1620)

      記憶方面,Opus 4.7 更會用基于文件系統的記憶。跨多輪、多 session 的長任務里記得住重要筆記,開新任務時需要的前置上下文更少

      其他 benchmark

      官方博客里還給出了辦公、文檔推理、長上下文、生物、長程一致性等基準的詳細數據

      辦公任務


      文檔推理


      長上下文推理


      生物


      長程一致性


      Anthropic 還特別標注了 benchmark 上的幾個細節。Terminal-Bench 2.0 用的是 Terminus-2 harness 關閉 thinking 模式。CyberGym 上 Opus 4.6 的分數從原報的 66.6 更新到 73.8。SWE-bench Verified / Pro / Multilingual 上做了記憶化篩查,排除可能被模型記住的問題后,Opus 4.7 對 Opus 4.6 的領先仍然成立

      和競品對比的時候,用的是 API 可用的最好版本,GPT-5.4 和 Gemini 3.1 Pro 都是這個口徑

      入口

      模型字符串:claude-opus-4-7

      Claude 所有產品已經切到 Opus 4.7。API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry 同步可用

      Claude Code 用戶默認 effort 拉到 xhigh,Pro/Max 有 3 次免費 /ultrareview,Max 用戶開啟 auto mode

      參考材料

      微信打不開外鏈,長按復制 URL 到瀏覽器打開

      Opus 4.7 發布公告

      https://www.anthropic.com/news/claude-opus-4-7

      Claude Opus 4.7 System Card

      https://anthropic.com/claude-opus-4-7-system-card

      Claude API 模型總覽

      https://platform.claude.com/docs/en/about-claude/models/overview

      從 Opus 4.6 遷移到 Opus 4.7 的官方指南

      https://platform.claude.com/docs/en/about-claude/models/migration-guide#migrating-to-claude-opus-4-7

      Effort 參數文檔

      https://platform.claude.com/docs/en/build-with-claude/effort

      高分辨率 Vision 能力文檔

      https://platform.claude.com/docs/en/build-with-claude/vision

      Claude Code slash 命令文檔(含 /ultrareview)

      https://code.claude.com/docs/en/commands

      Auto mode 發布說明

      https://claude.com/blog/auto-mode

      Project Glasswing 發布公告

      https://www.anthropic.com/glasswing

      Cyber Verification Program 申請入口

      https://claude.com/form/cyber-use-case

      GDPval-AA 榜單

      https://artificialanalysis.ai/evaluations/gdpval-aa

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      二手車市場幾乎沒有新能源車,“賣得太快”還是“不敢收”?

      二手車市場幾乎沒有新能源車,“賣得太快”還是“不敢收”?

      華夏時報
      2026-05-08 09:50:03
      全網瘋傳的“八段錦神話”破滅了,網友:太毒了……

      全網瘋傳的“八段錦神話”破滅了,網友:太毒了……

      人格志
      2026-05-09 20:17:27
      10日凌晨世乒賽:法國出奇兵戰國乒!王楚欽對決科頓、小勒布倫

      10日凌晨世乒賽:法國出奇兵戰國乒!王楚欽對決科頓、小勒布倫

      陌識
      2026-05-10 01:54:40
      國防部:已成功配齊“航母五件套”

      國防部:已成功配齊“航母五件套”

      大象新聞
      2026-05-09 16:46:07
      深圳6歲男童吃生菜包烤肉后,全身出現大片青斑、血腫

      深圳6歲男童吃生菜包烤肉后,全身出現大片青斑、血腫

      聽心堂
      2026-05-09 18:11:29
      臺積電的美國亞利桑那廠已悄然失敗,400億美元燒完,良率不到日本廠一半

      臺積電的美國亞利桑那廠已悄然失敗,400億美元燒完,良率不到日本廠一半

      風向觀察
      2026-05-09 13:29:53
      近10年學術不端名單:協和“4+4”董襲瑩、“首席科學家”郭偉、“不知知網”翟天臨

      近10年學術不端名單:協和“4+4”董襲瑩、“首席科學家”郭偉、“不知知網”翟天臨

      網易新聞出品
      2026-05-09 18:38:13
      大快人心!中國民航新規出爐:日本航空過境中國好日子即將到頭!

      大快人心!中國民航新規出爐:日本航空過境中國好日子即將到頭!

      影像溫度
      2026-05-09 10:27:26
      A股唯一一家,比爾蓋茨重倉固態電池,一季度從0加到1060萬股

      A股唯一一家,比爾蓋茨重倉固態電池,一季度從0加到1060萬股

      長風價值掘金
      2026-05-09 21:00:27
      法拉奇橫空出世,英國政治正式進入“川普化”新時代

      法拉奇橫空出世,英國政治正式進入“川普化”新時代

      壹家言
      2026-05-09 16:03:04
      隨著日本2-1,卡塔爾2-0印尼,U17亞洲杯真亂了:中國隊0分還活著

      隨著日本2-1,卡塔爾2-0印尼,U17亞洲杯真亂了:中國隊0分還活著

      侃球熊弟
      2026-05-10 02:35:26
      駐加爾各答總領館再次提醒中國公民避免自尼泊爾誤入印度國境

      駐加爾各答總領館再次提醒中國公民避免自尼泊爾誤入印度國境

      環球網資訊
      2026-05-09 21:42:17
      汪峰森林北被曝分手,森林北立即斷舍離,自嘲是汪峰5任中最差的

      汪峰森林北被曝分手,森林北立即斷舍離,自嘲是汪峰5任中最差的

      露珠聊影視
      2026-05-09 22:16:53
      香港富豪孫女被綁架,綁匪拿到2800萬后逃跑,警方最新透露:女事主鎮定、有條理,一個線索成破案關鍵

      香港富豪孫女被綁架,綁匪拿到2800萬后逃跑,警方最新透露:女事主鎮定、有條理,一個線索成破案關鍵

      南方都市報
      2026-05-09 15:00:26
      3-0爆冷世界第五仰天怒吼!18歲天才閃耀 雷洋:法國隊有冠軍相

      3-0爆冷世界第五仰天怒吼!18歲天才閃耀 雷洋:法國隊有冠軍相

      顏小白的籃球夢
      2026-05-09 09:29:53
      攤牌!!除了球隊老大!全部都賣!!!

      攤牌!!除了球隊老大!全部都賣!!!

      柚子說球
      2026-05-09 22:44:07
      這是迄今為止,見過身材最美的女人之一,不接受反駁

      這是迄今為止,見過身材最美的女人之一,不接受反駁

      阿廢冷眼觀察所
      2026-05-10 03:30:01
      1-2不敵日本,中國男足遭遇亞洲杯2連敗,晉級僅存理論可能

      1-2不敵日本,中國男足遭遇亞洲杯2連敗,晉級僅存理論可能

      側身凌空斬
      2026-05-10 01:54:50
      女子190元買榴蓮“僅退款”被拘,往返1600公里討公道的河南商家最新發聲:買家才20多歲,她父母想協商和解,我要求依法處理,并公開道歉

      女子190元買榴蓮“僅退款”被拘,往返1600公里討公道的河南商家最新發聲:買家才20多歲,她父母想協商和解,我要求依法處理,并公開道歉

      大風新聞
      2026-05-09 10:00:07
      套路一模一樣!2026 年漢坦病毒剛露頭,西方又準備好了老劇本

      套路一模一樣!2026 年漢坦病毒剛露頭,西方又準備好了老劇本

      魔都姐姐雜談
      2026-05-09 20:58:28
      2026-05-10 04:23:00
      賽博禪心
      賽博禪心
      拜AI古佛,修賽博禪心
      429文章數 53關注度
      往期回顧 全部

      科技要聞

      美國政府強力下場 蘋果英特爾達成代工協議

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      體育要聞

      成立128年后,這支升班馬首奪頂級聯賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認不出!

      財經要聞

      多地號召,公職人員帶頭繳納物業費

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      數碼
      旅游
      健康
      房產
      教育

      數碼要聞

      有鴻蒙·更美的——全球首臺鴻蒙智選美的智能空調上市

      旅游要聞

      不用長途奔波!北京城區隨處是治愈人心的初夏花海

      干細胞能讓人“返老還童”嗎

      房產要聞

      低價甩賣!海口這個地標商業,無人接盤!

      教育要聞

      天津女教師懟家長!完整錄音曝光,老師很囂張,飯碗恐不保了

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲首页精品国产首页| 日本精品久久中文字幕| 亚洲欧美另类精品久久久| 亚洲精品久荜中文字幕| 亚洲精品无码日韩国产不卡av| 成人无码午夜在线观看| 第一福利视频| 五十路熟妇| 亚洲国产欧美日韩第一香蕉| 亚洲精品第一国产综合精品| 少妇人妻偷人免费观看| 亚洲人成网网址在线看| 狠狠撸在线| 久久涩综合| 国产欧美精品一区二区三区四区 | 亚洲夂夂婷婷色拍ww47| 午夜福利激情一区二区三区| 亚洲a免费| 一本色道久久综合狠狠躁| 美女一区二区三区亚洲麻豆| 开心五月婷婷综合网站| 国产黄色三级三级看三级| 国产真实乱对白精彩久久| 激情人妻自拍中文夜夜嗨| 麻豆最新国产AV原创精品| 另类图片亚洲人妻中文无码| 国产乱人伦偷精品视频下| 在线精品自拍亚洲第一区| 亚洲国产精彩中文乱码av| 亚洲成AV人无码中文字幕 | 亚洲日韩在线中文字幕第一页 | 自拍校园亚洲欧美另类| 中文字幕中文字幕久久| 四虎库影成人在线播放| 美女视频黄频大全免费| 91精品国产丝袜在线国语| av片免费播放| 一区av在线| 国产成人精品2021| 亚洲精品午夜精品| 亚洲成av人片无码迅雷下载|