![]()
本文來自微信公眾號:字母AI,作者:袁心玥、苗正,題圖來自:視覺中國
Anthropic宣布,公司已完成H輪融資,融資金額達650億美元,投后估值為9650億美元。
這筆融資將被Anthropic用來繼續(xù)研發(fā),同時擴大算力產(chǎn)能,滿足現(xiàn)在市場對Claude越來越大的需求。
![]()
與此同時,Claude Opus 4.8被端上來了!!
![]()
這大晚上的,我們還以為要等到六月份呢……
在Claude Code 2.1.154版本中,輸入/model后的模型選擇菜單里,Opus一欄已經(jīng)更新為Opus 4.8。
![]()
老規(guī)矩,APP用戶和電腦端都已經(jīng)可以用上最新的Opus 4.8模型,API稍晚一些。
![]()
![]()
不過,Opus 4.6被下了……
Opus 4.8更新速覽
根據(jù)Anthropic官方介紹,Opus 4.8具有更敏銳的判斷力、對自身進步的更誠實的態(tài)度,以及更長時間獨立工作的能力。
重要的是,價格保持不變。
常規(guī)價格仍是輸入5美元/百萬token、輸出25美元/百萬token;Fast mode價格為輸入10美元/百萬token、輸出50美元/百萬token。
Opus 4.8的Fast mode速度大約是標準模式的2.5倍;同時,F(xiàn)ast mode這次降價后,價格約為此前Fast mode的三分之一。
![]()
從Anthropic自己的描述看,Opus 4.8并不是一次大跨步的模型代際更新。
官方在新聞稿末尾是這么寫的:“Opus 4.8相比Opus 4.7,并沒有很夸張的提升,更多的是那種用戶真正用起來后,才能感受到的細節(jié)升級。”
Anthropic還提到,公司正在開發(fā)一類成本更低、但能力接近Opus的模型。同時也計劃推出比Opus更強的新類型模型,就是公開的秘密——Mythos。
![]()
可以理解為,Opus 4.8更像是一次面向真實工作場景的打磨:不再把數(shù)字拉得特別嚇人,但要讓模型在復雜任務里更可靠、更會協(xié)作、更少裝懂。
Anthropic這次尤其強調(diào),Opus 4.8變得更誠實了。
所謂誠實,不只是少胡說,而是模型在自己拿不準的時候,更愿意把不確定性說出來;在沒有足夠證據(jù)時,也更少強行給出一個看似確定的結(jié)論。
Anthropic稱,在內(nèi)部評測中,Opus 4.8如果寫出了有問題的代碼,更可能主動指出問題,而不是假裝一切正常。相比上一代,它“發(fā)現(xiàn)自己代碼缺陷卻不說”的情況大約減少了四分之三。
![]()
安全性上,Anthropic也給出了類似的判斷。公司安全團隊認為,Opus 4.8在尊重用戶判斷、維護用戶利益等方面表現(xiàn)更好;與此同時,欺騙、迎合濫用請求等不對齊行為明顯少于Opus 4.7,已經(jīng)接近Claude Mythos Preview的水平。
這延續(xù)了Anthropic最近一貫的姿態(tài)。無論是強調(diào)Opus 4.8更愿意承認不確定性,還是回應《人性的偉大之處》里關于AI與人類尊嚴的討論,Anthropic都在反復傳遞同一個信號:模型越能干,越不能只是聽話和自信,它必須知道邊界,承認不確定性,并且盡量維護用戶的真實利益。
這種敘事可以增強用戶對于Anthropic模型的信任,促進企業(yè)合作,也有助于Anthropic為未來IPO鋪路。
Opus 4.8發(fā)布的同時,Anthropic還推出了幾項功能更新,其中最重要的是動態(tài)工作流,Anthropic專門發(fā)了一篇文章來介紹。
![]()
該功能還在研究預覽階段,將面向Enterprise、Team和Max計劃開放。
按照Anthropic的說法,它可以讓Claude Code處理更大規(guī)模的問題。Claude會先規(guī)劃工作,再在一個會話里運行數(shù)百個并行subagents,最后在向用戶匯報前驗證輸出。配合Opus 4.8,這些agents可以運行更久,更適合代碼遷移、全庫排查、長期重構(gòu)這類需要持續(xù)推進的異步工作流。
官方舉的例子是,Claude Code現(xiàn)在可以完成跨數(shù)十萬行代碼庫的遷移任務,從啟動一直推進到合并,并使用項目原有的測試套件來檢查結(jié)果。
![]()
另外,effort control(響應力度控制)也從Claude Code這樣的開發(fā)者場景,進入了claude.ai(網(wǎng)頁版Claude)和Claude Cowork。
Claude Code里過去已經(jīng)有類似的effort控制,用/effort可以調(diào)不同的思考強度,現(xiàn)在claude.ai和Claude Cowork 現(xiàn)在也有了這個控制項,用戶可以在模型選擇器旁邊直接調(diào)Claude對一次回答投入多少effort。
低effort的情況下Claude就回得更快、消耗更少;高effort就是讓它多花一些token,把問題想得更細,更適合那種復雜的任務。
在Claude Code里,Opus 4.8默認使用高effort模式。Anthropic的意思是,這樣能在質(zhì)量和速度之間取得比較好的平衡。做代碼任務時,它的token消耗和Opus 4.7 默認模式差不多,但完成效果更好。
還有一個更偏開發(fā)者的小更新,Messages API現(xiàn)在支持在messages數(shù)組里插入system條目了。你可以在任務執(zhí)行過程中更新Claude的系統(tǒng)指令,不用打斷prompt緩存,非常適合長流程任務。
動態(tài)工作流
比起模型性能,本次更新的重中之重,就是前文提到的Claude Code的動態(tài)工作流。
![]()
《木蘭辭》有句話,叫東市買駿馬,西市買鞍韉,南市買轡頭,北市買長鞭。
而這,就是動態(tài)工作流的核心。
以前你讓Claude Code做一個復雜任務,它是用一個主Agent,一步步讀代碼、改代碼、跑測試、再修。
問題是,大型工程任務往往太大。一個bug可能關聯(lián)幾十個文件,一次遷移可能要改幾百個文件。單個Agent一條線往下跑,容易漏東西,也容易中途跑偏。
動態(tài)工作流要做的事情就是調(diào)度,類似于客戶經(jīng)理。它不干活,但是它安排合適的人干活。
Claude先把你的任務拆成一套工作流,然后自動拉起幾十到幾百個并行的子Agent。每個子Agent負責一個子任務,比如掃某個模塊、驗證某個結(jié)論、找反例、跑測試這些。
最后Claude再把這些結(jié)果匯總、交叉驗證,給你一個統(tǒng)一答案。
它的核心不是讓一個Agent更聰明,是讓Claude自動組織一群Agent一起干活。
官方舉的例子是Bun從Zig到Rust的遷移試驗,動態(tài)工作流參與了約75萬行Rust代碼遷移,11 天內(nèi)從首次提交推進到合并,并讓99.8%的既有測試套件通過。
但與之相對的,成本也增加了。官方特意提醒,動態(tài)工作流會明顯消耗更多token,第一次觸發(fā)時會讓用戶確認;Enterprise管理員也可以選擇直接禁用。
4.7到4.8,只相隔了42天
如果按公開發(fā)布時間算,Opus 4.5的發(fā)布日期是2025年11月24日,Opus 4.6是2026年2月5日,兩者相隔73天;Opus 4.7是2026年4月16日,距離4.6相隔70天;Opus 4.8是2026年5月28日,距離4.7只有42天。
為什么這么快?
網(wǎng)上普遍認為是4.7沒有達到用戶預期。
Anthropic發(fā)布4.7的時候說,它能把更難的編程任務交給模型,并且模型還能在匯報前驗證結(jié)果。
但不少用戶反饋稱,4.7只是會簡單搜索一下就直接下結(jié)論,也沒有真正地交叉驗證結(jié)果。AMD AI 負責人絲黛拉·勞倫佐(Stella Laurenzo)表示,Claude Code在使用4.7做大型工程時,很容易跑偏。
如果只是模型性能沒達標也就算了,問題是官方自己也承認,4.7的tokenizer會讓同樣輸入變成約1.0到1.35倍token,同時高effort下會花更多token。
等于說錢多花了,結(jié)果沒有提升,甚至還下降了。
從官方和早期測試者的說法看,4.8至少瞄準了幾個4.7的痛點,比如工具調(diào)用、長任務穩(wěn)定性、代碼缺陷自檢、回復噪音,以及在不確定時硬撐結(jié)論的問題。
但要說“完全解決”,還太早,還得等后續(xù)各種大型工程項目的反饋結(jié)果出來才能看清楚。
關鍵在于,Anthropic現(xiàn)在可不是追趕者了,它是領跑者。
就在4.8發(fā)布的前一天,外媒報道稱,Anthropic目前的收入很可能已經(jīng)比OpenAI至少高出 35%。
Anthropic年化收入接近450億美元,OpenAI約為330億美元。雖然ARR不等同于最終利潤,但足以改變市場敘事。
這兩家公司都是準備在2026年下半年IPO的,如果Anthropic先過會,那OpenAI的故事就不好講了。
這也讓Opus 4.8多了一層含義。它是在給資本市場遞材料,證明4.7雖然不行,但是Anthropic能立馬推出新版本,以支撐自己超高的估值和收入。
本文來自微信公眾號:字母AI,作者:袁心玥、苗正
本內(nèi)容由作者授權(quán)發(fā)布,觀點僅代表作者本人,不代表虎嗅立場。如對本稿件有異議或投訴,請聯(lián)系 tougao@huxiu.com。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4862546.html?f=wyxwapp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.