網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

Claude Opus 4.7深夜發(fā)布，編程能力狂飆

2026-04-18 08:16:06　來源: 互聯(lián)網(wǎng)早讀課

北京舉報

分享至

Anthropic昨夜扔下了一顆重磅炸彈。Claude Opus 4.7正式上線。

在最關鍵的軟件工程能力上，它完成了對GPT-5.4的超越，甚至在某些指標上逼近了尚未全面開放的Claude Mythos Preview。

01 編程能力暴漲

Opus 4.7在代碼領域的表現(xiàn)相當出色。

在權威的SWE-bench Pro基準測試中，Opus 4.7的得分從4.6版本的53.4%直接跳漲至64.3%。

這是什么概念？

GPT-5.4在同一測試中的成績是57.7%，而Opus 4.7一口氣拉開了近7個百分點的差距。

而在SWE-bench Verified的成績是87.6%，相比4.6的80.8%提升近7個百分點。

這些數(shù)據(jù)的早期測試用戶反饋，以前那些需要工程師盯著看的高難度編程任務，現(xiàn)在可以放心地交給Opus 4.7獨立完成。

因為它不僅能處理復雜的長時任務，還會主動驗證自己的輸出，甚至會在執(zhí)行前進行「自我糾錯」。

Stripe的工程團隊在測試中提到：「Opus 4.7能在規(guī)劃階段就捕捉到自己的邏輯缺陷，并加速執(zhí)行。這對需要大規(guī)模交付可信金融解決方案的我們來說，可能是游戲規(guī)則的改變者。」

02 視覺3倍分辨率

Opus 4.7新版本支持高達2,576像素（長邊）的圖像輸入，分辨率是前代模型的三倍以上，約3.75兆像素。

它可以看清復雜技術圖紙上的微小標注，能準確解讀化學分子的立體結構，在計算機操作任務中，能從高分辨率截圖里識別出細枝末節(jié)的UI元素。

在CharXiv視覺推理基準測試中，Opus 4.7的得分從4.6的 69.1% 躍升至 82.1%；配合工具使用時，更是達到了91.0%，相較于前代的84.7%提升巨大。

XBOW，即自主滲透測試平臺，的測試數(shù)據(jù)更為震撼：在視覺敏銳度基準測試中，Opus 4.7得分98.5%，而Opus 4.6僅為54.5%。

「我們最大的痛點一夜之間消失了」，XBOW團隊表示。

03 金融、法律、科研等方面也大有提升

別以為Opus 4.7只是個程序員專屬模型。在多個專業(yè)領域，它都展現(xiàn)出了專家級的素養(yǎng)。

金融領域，它在Finance Agent v1.1測試中取得64.4%的成績，并在 GDPval-AA，即第三方經(jīng)濟價值知識工作評估測試中創(chuàng)下Claude系列模型的最佳表現(xiàn)。

從財務建模到專業(yè)演示文稿制作，Opus 4.7被評價為「比4.6更嚴謹?shù)慕鹑诜治鰩煛埂?/p>

法律領域，在BigLaw Bench測試中，Opus 4.7在高難度任務下達到 90.9%的準確率。

它能準確區(qū)分「轉讓條款」和「控制權變更條款」，要知道，這可是前沿模型普遍頭疼的微妙區(qū)別。

科研與多語言，在Graduate-level reasoning測試中，Opus 4.7達到 94.2%，與GPT-5.4 Pro的94.4%和Gemini 3.1 Pro的94.3%處于同一梯隊；多語言問答（MMMLU）也提升至91.5%。

04 新版本特性

Opus 4.7在行為模式上有一個有趣的轉變：它變得更擅長遵循指令，也更愿意表達專業(yè)觀點。

一方面，它的指令遵循能力顯著增強。

Anthropic特別提示，以前為舊版本編寫的提示詞可能需要重新調(diào)整，因為Opus 4.7會嚴格按照字面意思執(zhí)行，而不會像4.6那樣寬松解釋或跳過部分指令。

另一方面，它在技術討論中表現(xiàn)出更強的專業(yè)素養(yǎng)。

Replit團隊注意到：它會在技術討論中提出反駁，幫助我做更好的決策。感覺真的像一個更好的同事，而不是一個只會說好的的應聲蟲。

此外，Opus 4.7在文件系統(tǒng)記憶方面也有改進，能在長時間、多會話的工作中記住重要筆記，減少重復上下文的輸入。

05 安全、價格與獲取方式

安全防護是這次發(fā)布的重要一環(huán)。

Anthropic表示，Opus 4.7是網(wǎng)絡安全風險研究項目框架下的首個模型，其網(wǎng)絡攻擊能力相比Mythos Preview已被差異化降低。

模型內(nèi)置了自動檢測機制，可阻止高風險的網(wǎng)絡安全濫用請求。

當然，合法的漏洞研究、滲透測試和紅隊測試并不在此列，安全專業(yè)人士可申請加入全新的Cyber Verification Program。

價格方面，Opus 4.7維持與4.6相同的定價，輸入定價$5/百萬token，輸出定價$25/百萬token。

目前，Claude網(wǎng)頁端和App已全面上線，API模型名稱為claude-opus-4-7，同時登陸Amazon Bedrock、Google Cloud Vertex AI和Microsoft Foundry。

但Claude近日要搞AI實名制，國內(nèi)用戶可能體驗不到這波更新了。

（注：本文數(shù)據(jù)及引述均來自Anthropic官方發(fā)布）

來源 | AI普瑞斯（ID：AIPress2025）

作者 | AI普瑞斯 ; 編輯 | 呼呼大睡

內(nèi)容僅代表作者獨立觀點，不代表早讀課立場

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

一群人玩“猜”啤酒大戰(zhàn)，男子精準選到有啤酒那杯

南陽日報 2026-05-16 16:22:41
310 跟貼 310
飯店里一條魚不斷噴水噴壞電視，獲1000萬網(wǎng)友圍觀，老板：將放生

星視頻 2026-05-16 18:09:54
2492 跟貼 2492

國內(nèi)首批103號高標號賽級汽油正式投用

央視新聞客戶端 2026-05-16 22:19:36
2281 跟貼 2281

勞模喊話外國友人：你的5000美元長成了參天大樹

央視新聞 2026-05-16 20:48:50
1632 跟貼 1632
武功山景區(qū)遭“臭屁蟲”圍攻？有游客調(diào)侃“張嘴能吃飽”，景區(qū)提醒：可自備防蟲藥物

瀟湘晨報 2026-05-14 17:33:19
998 跟貼 998

熱聞|凱恩帽子戲法超越萊萬造德甲神跡！拜仁5-1大勝科隆完美收官

齊魯壹點 2026-05-17 06:41:25
195 跟貼 195

申花的子彈是不是打光了

上觀新聞 2026-05-17 10:08:08
4 跟貼 4
男子稱裝修時發(fā)現(xiàn)，住了10年的房子樓上還有一層，有窗戶還有窗簾

星視頻 2026-05-16 18:57:39
219 跟貼 219

山姆爆火山東，本土商超先別急著慌

半島官網(wǎng) 2026-05-17 09:29:44
15 跟貼 15
三大運營商即將免月租？多方回應

澎湃新聞 2026-05-17 00:00:09
176 跟貼 176
“抱抱盲兔”擺拍細節(jié)曝光！律師回應

環(huán)球網(wǎng)資訊 2026-05-17 09:38:59
0 跟貼 0
歐盟將對中國采取強硬政策要說服德國敢與中國正面杠

澎湃新聞 2026-05-17 07:16:43
7 跟貼 7
云南一男子凌晨在民宿前臺偷拿房卡，帶著女朋友一起“免費”入住，民宿回應：房費才70元，沒有報警處理

大風新聞 2026-05-16 18:33:03
168 跟貼 168
聯(lián)合國教科文組織報告：中國成為新興留學目的地

參考消息 2026-05-16 13:41:01
239 跟貼 239
“法拉利大叔”許文飆回家鄉(xiāng)杭州，西湖邊即興拉丁舞引爆全場

星視頻 2026-05-16 18:37:10
242 跟貼 242
降落時拍到機翼疑似異常，乘客反饋被獎飛機模型，深圳航司稱將停飛檢修該飛機

界面新聞 2026-05-16 18:07:02
110 跟貼 110
上海一旅行社轉走老人200萬業(yè)務員：我不跟記者談

新聞坊 2026-05-17 11:48:53
0 跟貼 0
首次海上同框 “愛達·花城號”邂逅“愛達·魔都號”

環(huán)球網(wǎng)資訊 2026-05-17 08:15:34
51 跟貼 51
泰蘭尼斯1879元童鞋到底價值幾何？制鞋代工廠：做一雙鞋我們就賺幾塊錢

每日經(jīng)濟新聞 2026-05-17 08:14:09
0 跟貼 0
WSBK捷克站正賽首回合，張雪機車車手斬獲賽季第四冠

澎湃新聞 2026-05-16 19:02:26
0 跟貼 0
重慶巫溪回應“救護車捎帶化肥”：系駕駛員轉運完患者后購置

南方都市報 2026-05-17 12:26:19
0 跟貼 0
從徐德智回國，到美國記者街頭喝豆汁，到鼓嶺緣：能看出啥？

新民周刊 2026-05-17 09:11:41
0 跟貼 0
四川大擺蕩墜亡事件追蹤：大擺蕩釋放開關提前打開致游客墜亡

極目新聞 2026-05-17 12:25:30
0 跟貼 0

汽車要聞

手機 / 數(shù)碼

房產(chǎn) / 家居

Claude Opus 4.7深夜發(fā)布，編程能力狂飆

三大運營商即將免月租？多方回應

福克斯主播在北京非機動車道出鏡 美網(wǎng)友：簡直是恥辱

福克斯主播在北京非機動車道出鏡 美網(wǎng)友：簡直是恥辱

馬刺2號，少年老成，這集看過？

《主角》劉浩存上線，死別猝不及防

OpenAI和蘋果的“聯(lián)盟”即將破裂

大五座SUV卷王！樂道L80上市 租電15.68萬元起

態(tài)度原創(chuàng)

官方良心！小米推出電池升級服務：老機型換大電池 再戰(zhàn)兩年

軍事英語！快速記單詞，趣味學英語，你還知道哪些？

華碩ROG魔盒Pro?Max?電競路由器上架：雙萬兆，低至3199元

老黃埔熱銷之下，珠江春，為何去化僅3成？

伊姐周六熱推：電視劇《雨霖鈴》；電視劇《黑夜告白》......

福克斯主播在北京非機動車道出鏡美網(wǎng)友：簡直是恥辱

福克斯主播在北京非機動車道出鏡美網(wǎng)友：簡直是恥辱

大五座SUV卷王！樂道L80上市租電15.68萬元起

官方良心！小米推出電池升級服務：老機型換大電池再戰(zhàn)兩年