<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      實測Claude Opus 4.7,好好的模型也開始不說人話了。

      0
      分享至

      果不其然,最近一周Claude天天崩,就是為了新模型做儲備。

      于是昨晚10點半,Claude Opus 4.7發布了。

      這玩意火到什么程度呢,我自己開發的給公司內部用的全網AI信息監控的產品AIHOT上,監控了精挑細選的幾十個有價值的信源,一般一個信息,有3個信源同時報道,就已經比較受關注了。

      如果有5到6個,那就是大熱點了。

      但是Claude Opus 4.7這玩意,有尼瑪10個信源同時發布= =


      給我一下子整不會了。

      目前Claude Opus 4.7已經全渠道上線。

      我10點半下的飛機,一下飛機就發現手機上可以用了。


      Claude Code里面也更新了。


      也是1M的上下文,沒有減量,還是挺爽的。

      最屌的是,凌晨3點的時候,直接把我一周的額度,給重置了。


      Claude第一回做了點人事。


      我知道很多朋友肯定會說哎你不怕KYC或者認證啥的問題嗎,我只能說,真的遇到了或者被遣返了再說吧,我也沒有任何解法,這就是懸在頭上達摩利斯之劍,要不是在知識創作上真的沒有啥替代品,能跟Claude掰掰手腕的都沒有,我真的早換了。。。

      現在的態度就是,能用一天是一天,誰叫Claude模型真的牛逼,Claude Code這個Agent框架又這么好用呢。

      說回Claude Opus 4.7。

      價格跟4.6完全一樣,$5/M輸入、$25/M輸出,沒有變化。

      跑分就不細展開講了,反正現在大家風氣就是贏學,該贏的都贏了,你要是不贏你也沒臉放出來。


      最有意思的是,Claude Opus 4.6絕大多數的性能從官方發出來的看,完全沒跑過GPT-5.4,這個是最有意思的,可以算是第一次承認,我的Opus 4.6在編程上打不過GPT 5.4。

      這個其實也跟我的體感一致,很多產品BUG來來回回搞不了的GPT-5.4全部都能干,唯一就是GPT-5.4在創作和一些用戶體驗設計上真的是一坨屎,一大坨巨大的屎。

      Claude知道我要的交互設計是什么樣的,什么樣的頁面是一個用戶體驗的很絲滑的頁面,GPT-5.4做出來的我作為一個用戶體驗設計師,那玩意我真的用不明白,一個個都像給黑客用的后臺。

      然后創作能力幾乎為0,你在影視行業幾乎可以看到絕大多數編劇都是用Claude來輔助自己優化劇本,單你絕對看不到有幾個好編劇會用GPT-5.4來輔助自己,真的,最頂級的那幫做創作者,真的是會用腳投票的。

      這就是很大的差距,Claude Opus 4.5和4.6,牛逼就牛逼在水桶和全面。

      但是這次,Opus 4.7我實測下來,還是有一些不一樣的感覺。

      有幾個關鍵更新點,我們一個一個說下。

      1. 又一次隱形漲價了。

      Anthropic這次換了新的tokenizer。

      博客原文說,新的tokenizer改進了文本處理,trade-off是同樣的輸入現在會被切成更多token,大概是原來的1.0到1.35倍,具體看內容類型。


      意思就是,你把同一段代碼、同一份文檔、同一個prompt丟給4.7和4.6,4.7要多吃最多35%的token。

      雖然可能效果確實更好了,但是實打實的,Token消耗又變得更高了。

      API的定價$5/$25確實沒漲。

      但同樣的任務,token消耗多了35%,你最后賬單可能也要多燒不少了。

      他們的意思就是,如果你的任務,每個請求吃更多token,但因為模型更準、一次過的概率更高、少了來回修改的輪次,所以整體你花的錢沒那么多。

      邏輯上沒毛病,但這個邏輯成立的前提是,你的任務是4.7真的擅長的那種高難的復雜任務。

      如果你日常跟Claude對話的是一些它提升不明顯的場景,比如知識管理創作做策劃方案數據分析之類的這種,那你可能就是純純的確實更燒token了。

      好慘,牛逼模型的Token,真的是這個世界越來越值錢的東西。

      2. 視覺能力提升巨大。

      這個我前面提過,XBOW的視覺測試,4.6是54.5%,4.7是98.5%。

      先說一下XBOW是啥。

      這家公司2024年成立,干的事兒一句話概括就是讓AI自己去當白帽黑客,做的是autonomous penetration testing,自主滲透測試,今年3月剛拿了1.2億美金融資,是這個賽道里目前跑最快的一家。

      他們測模型的視覺能力是因為AI要自己去打滲透,就得看得懂各種亂七八糟的瀏覽器界面、后臺管理系統、開發者工具里的網絡請求、錯誤提示彈窗,這些畫面密度極高、細節極多,模型視覺能力差一點,那基本就GG了。

      4.6只有54.5%,也就是一半的圖模型看得迷迷糊糊的,但4.7直接98.5%,基本等于全部通過。

      成功率從一半直接干到近乎滿,這個意義還是挺重要的。

      核心其實除了多模態能力的提升,也因為4.7支持的圖片分辨率提升了。

      現在最多可以處理2576像素長邊的圖、大約3.75兆像素,是之前Claude模型的3倍多。

      Claude自己的視覺基準評測提升也很明顯。


      我以前有的時候偷懶,直接給Claude Opus 4.6傳一張截圖,說XXX有問題,或者這個數據它不對,它能大概認出你在干啥,但細節經常看不清。

      所以導致經常會有錯誤,我們自己的AIHOT網站就是個典型,字還挺多的,各種卡片兼容的展示樣式和邏輯我之前跟Claude Opus 4.6改了好久。


      有的時候來來回回改不明白,經常把我的文字識別錯誤。

      但今天測了一下,幾乎沒有識別錯誤的問題了。

      這個對于知識工作者是一個大的BUFF加成。

      我都能想象到很多場景了,比如做律師的朋友扔一份幾十頁的合同掃描件給它,它能把里面的日期、條款編號、金額都讀對。

      比如一個做金融的朋友扔一份年報PDF給它,它能把圖表里的每根柱子都抓出來。

      比如一個做產品的朋友扔一堆競品截圖給它,它能逐個分析界面上的每個組件啥的。

      這個升級確實很好,在多模態上發力了。

      3. 審美有不錯的提升。

      我之前做一些涉及到用戶體驗還有美學的,其實說實話,我覺得Claude Opus 4.6效果不是很好,屬于比上不足比下有余的。

      跟Gemini相比差距還是很明顯,很多視覺效果都做的并不好,還有交互設計這塊,也非常的呆,很多時候是不以用戶為核心,而是為了完成開發任務為核心。

      所以逼的我在CLAUDE.md里加了一大段限制。


      而這次,可能得益于多模態能力的提升,我用Claude Opus 4.7,順手做了一下我之前要做但是還沒來得及做的公司招聘網站,效果出奇的好。

      因為我們現在很缺人,還在瘋狂招人中,所以需要這么一個東西。

      我就描述了一下我的需求,這里沒有用任何Skill,Fontend Skill被我刪了。


      它就正常列計劃,然后開跑了。


      第一輪出來基本可用,我又簡單微調了兩輪,加了logo和其他職位的信息,就出來了,一共耗時20分鐘。

      網址在此:https://join.virxact.com/


      我覺得在這種微型項目的效果和開發體驗是要比Claude Opus 4.6好不少,審美更強了,也更聽得懂人話,動效效果也更強了,符合我想要的用戶體驗規則的。

      我自己還是相當滿意的。



      這里幫我們自己打個廣告,歡迎大家點進網站來投遞簡歷!

      4. 也開始不說人話了。

      這是讓我最失望的一個點。

      我平時會用Claude做很多很多的知識管理類的需求,不管是輔助創作,還是搜集資料,寫報告,做PPT,寫方案等等等等。

      Claude Opus 4.6我都覺得在創作上,文字品味是非常好的。

      而GPT-5.4和國內很多模型,其實是純粹的編程特化,在人味上極度缺失,典型的如GPT-5.4。

      之前我實在忍不了GPT-5.4就是因為垃圾話太多了,網上我找了一個案例。


      穩穩接住,根因,按這條切,收口,壓實這些破詞懂的都懂。

      然后這一次Opus 4.7,在我開發上面的招聘網站的時候,感覺看到了非常不好的傾向。

      我對文字還是稍微有點敏感的,當我看到這幾句的時候,我的PTSD就自動激活了。


      再也不會撞,不會爬到logo頭上,還有莫名其妙的破折號。

      我差點應激。

      然后立刻去讓它同文風續寫一下我昨天發的文章,直接心涼了半截。


      狗屎,一坨狗屎。

      一股子偽人味道,我真的佛了,好好的Claude,怎么也開始不說人話了。

      去社區里面搜了一下。

      果然,我不是一個人。


      說真的,我心態有點爆炸了。

      5. 一些新功能。

      再說一下新功能吧。

      Claude之前的effort檔位是low、medium、high、max四檔。

      4.7這次在high和max中間加了一檔,叫xhigh,extra high的縮寫。

      補上了high和max之間的跨度。

      之前Max燒的太狠,但是high有時候感覺又有點笨,這次來了個中間值,并且直接預設為默認了。


      然后是/ultrareview。

      這是Claude Code里一個新的命令,專門跑code review,會把你的代碼仔仔細細過一遍,找出所有的bug和設計問題。

      而且這玩意不便宜,跑一次可能要5~20美刀。


      Pro和Max用戶有3次免費的試用額度。

      真的貴。

      然后是Cyber Verification Program。

      這個可能是最容易被忽略、但我覺得最值得關注的一個點。

      Anthropic開了一個正式的通道,讓合法的安全研究、滲透測試、red-teaming可以申請使用Claude的某些原本受限的能力。

      申請入口是claude.com/form/cyber-use-case


      這個事的背景是,以前白帽子、安全團隊想用Claude做漏洞研究、做滲透測試,經常被模型一刀切拒絕。

      因為模型識別不了你是惡意還是合法,安全起見全拒。

      現在Anthropic說,合法從業者你可以來申請,我們走一個特殊流程,通過了給你開通相應能力。

      其實AI行業越來越走到這一步了,之前 Claude Mythos太牛逼了不敢給普通人放出來,因為可能真的會出事。

      但是你全拒和全開之間,其實需要一個身份核驗+分級授權的中間態。

      而且這個思路一旦跑通,后面會被大量復用。

      比如醫療場景的合規研究、金融場景的模擬攻擊演練、生物研究場景的合規用藥、甚至軍工領域的合法研發,都可以走類似的Verify通道。

      這是我覺得一個進入產業里,蠻有長期價值的一個設計。

      這次Claude Opus 4.7差不多就都講完了。

      看到編程能力和視覺能力的提升,我很欣喜。

      但是看到一個好好的有文字品味的模型,又一次倒在了不說人話上。

      說真的,我現在也有點被穩穩的接住了。

      三年,從GPT-3.5開始,一路用到現在。

      這三年里,我眼睜睜看著這些模型,一個接一個,變得越來越聰明,越來越能打,Benchmark一個比一個猛,SWE-bench一個比一個高。

      但也是這三年,我眼睜睜看著它們,一個接一個,都不會說人話了。

      所有公司卷的都是編程,編程,還是編程。

      我不是說編程不重要,我自己也是Claude Code的重度用戶,我公司內部現在一半的工具都是我用Claude Code搓出來的,編程能力對我來說非常非常重要。

      但問題是,一個模型,它不應該只是一個編程工具啊。

      語言,是人類所有智力活動的底座。一個好的語言模型,應該能寫小說,能寫詩,能寫散文,能陪你聊深夜三點睡不著的那點心事。

      但現在的大模型,好像除了會寫代碼,其他的什么都不會了。

      或者說,什么都在退步。

      畢竟好像沒啥商業價值的東西,沒法量化的東西,在AI公司眼里可能確實就不是高優先級。

      于是它們就被慢慢地、悄悄地、系統性地犧牲掉了。

      我真的覺得。

      這事還挺悲哀的。

      以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。

      >/ 作者:卡茲克

      >/ 投稿或爆料,請聯系郵箱:wzglyay@virxact.com

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      5月最不好惹的3個生肖:別人虧時候他們賺,別人賺時候他們多賺!

      5月最不好惹的3個生肖:別人虧時候他們賺,別人賺時候他們多賺!

      毅談生肖
      2026-05-15 11:49:53
      丈夫:你把工資拿娘家,兒子用啥?妻子:侄子都養了,兒子也能養

      丈夫:你把工資拿娘家,兒子用啥?妻子:侄子都養了,兒子也能養

      惟來
      2026-05-14 12:02:01
      突然強勢拉升!外交部就特朗普訪華情況答記者問,科創芯片ETF(588290)上漲1.32%

      突然強勢拉升!外交部就特朗普訪華情況答記者問,科創芯片ETF(588290)上漲1.32%

      每日經濟新聞
      2026-05-15 11:24:39
      男子酒后執意要開車,女友勸阻無效后下車走人,警方調查發現其并非第一次酒駕,已被刑事立案偵查

      男子酒后執意要開車,女友勸阻無效后下車走人,警方調查發現其并非第一次酒駕,已被刑事立案偵查

      極目新聞
      2026-05-14 22:36:50
      深夜,暴漲超43%!大牛股,突傳利好!

      深夜,暴漲超43%!大牛股,突傳利好!

      證券時報
      2026-05-15 00:13:10
      特斯拉推出“輕松貸” 五年月供可低至約2193元

      特斯拉推出“輕松貸” 五年月供可低至約2193元

      太平洋汽車
      2026-05-15 12:34:15
      醫生不會告訴你的秘密:這個部位越敏感,性生活越和諧

      醫生不會告訴你的秘密:這個部位越敏感,性生活越和諧

      精彩分享快樂
      2026-05-15 12:11:32
      有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

      有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

      夜深愛雜談
      2026-02-18 20:55:58
      日媒質疑國乒使詐,主帥點出王曼昱孫穎莎差距,梁靖崑獲三萬獎金

      日媒質疑國乒使詐,主帥點出王曼昱孫穎莎差距,梁靖崑獲三萬獎金

      三十年萊斯特城球迷
      2026-05-14 23:13:04
      1985年,國安叛徒藏身南美,中國6名兵王萬里鋤奸,FBI顏面盡失

      1985年,國安叛徒藏身南美,中國6名兵王萬里鋤奸,FBI顏面盡失

      干史人
      2026-04-14 21:10:03
      季后賽報銷!太陽決定交易!排隊給湖人道歉

      季后賽報銷!太陽決定交易!排隊給湖人道歉

      籃球教學論壇
      2026-05-15 11:23:11
      俄羅斯又開始許愿,要求烏克蘭撤出“俄羅斯領土”

      俄羅斯又開始許愿,要求烏克蘭撤出“俄羅斯領土”

      山河路口
      2026-05-13 20:35:10
      故宮留面子,天壇亮底線!特朗普訪華地大變,暗藏中國的大國格局

      故宮留面子,天壇亮底線!特朗普訪華地大變,暗藏中國的大國格局

      小小科普員
      2026-05-14 20:24:25
      中美會談結束,特朗普用4字評價,美媒發現:中國這次話說的很重

      中美會談結束,特朗普用4字評價,美媒發現:中國這次話說的很重

      尋墨閣
      2026-05-15 01:15:17
      里程全國第一,卻有30余縣“手無寸鐵”:廣東高鐵的繁華與盲區

      里程全國第一,卻有30余縣“手無寸鐵”:廣東高鐵的繁華與盲區

      普陀動物世界
      2026-05-14 11:47:14
      漢語是犧牲了什么,才成為世界最緊湊、最高效的語言?

      漢語是犧牲了什么,才成為世界最緊湊、最高效的語言?

      瓜哥的動物日記
      2026-05-13 00:58:37
      僅僅因為一個枕頭,性生活發生了翻天覆地的變化

      僅僅因為一個枕頭,性生活發生了翻天覆地的變化

      精彩分享快樂
      2026-05-15 12:07:56
      何炅工作室回應:沒通知我們啊

      何炅工作室回應:沒通知我們啊

      南方都市報
      2026-05-14 17:49:25
      乒乓球全錦賽延期!原因:與王楚欽和孫穎莎有關,球迷力挺王勵勤

      乒乓球全錦賽延期!原因:與王楚欽和孫穎莎有關,球迷力挺王勵勤

      老王大話體育
      2026-05-15 12:19:44
      97年我對女老師說我喜歡她,她紅著臉說:考上重點大學我就嫁給你

      97年我對女老師說我喜歡她,她紅著臉說:考上重點大學我就嫁給你

      千秋文化
      2026-05-02 19:36:54
      2026-05-15 13:11:00
      數字生命卡茲克 incentive-icons
      數字生命卡茲克
      反復橫跳于不同的AI領域,努力分享一些很酷的AI干貨
      517文章數 648關注度
      往期回顧 全部

      科技要聞

      兩年聯姻一地雞毛,傳蘋果OpenAI瀕臨決裂

      頭條要聞

      歡迎宴會座位公開:馬斯克黃仁勛與中國企業家同桌吃飯

      頭條要聞

      歡迎宴會座位公開:馬斯克黃仁勛與中國企業家同桌吃飯

      體育要聞

      德約科維奇買的球隊,從第6級聯賽升入法甲

      娛樂要聞

      方媛回應住男生單人間:女孩的配得感

      財經要聞

      特朗普的北京時刻

      汽車要聞

      雙零重力座椅/AI智能體/調光天幕 啟境GT7內飾發布

      態度原創

      旅游
      親子
      游戲
      本地
      公開課

      旅游要聞

      天壇“同款機位”,成為熱門打卡點

      親子要聞

      爸爸的貼心小棉襖,睡覺都要貼身上,光兒子的真羨慕!

      《地平線6》被怒噴政治正確!人物丑爆 男女不分

      本地新聞

      用蘇繡的方式,打開江西婺源

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 成av人片一区二区久久| 97无码精品人妻免費一区二区| 狠狠色综合一区二区| 99热久久这里只有精品| av不卡一区| 麻豆av一区二区天美传媒| 国产尤物AV尤物在线看| 国产一区日韩精品在线| 人妻少妇一区二区三区| 国产精品熟女亚洲av麻豆| 99在线免费观看视频| 影音先锋女人av噜噜色| 新密市| 亚洲第一福利网站在线观看| 国产成人亚洲综合图区| 少妇高潮水多太爽了动态图| 四虎国产精品永久在线看| 传媒视频??高清一区传媒| 久久精品免视看国产成人| 最近最新中文字幕在线第一页| 国产精品成人免费一区久久羞羞 | 色www永久免费视频| 国产XX00| 成人品视频观看在线| 国产成人自产拍免费视频| 九九在线视频精品播放| 国产高清一区二区不卡| 97色伦97色伦国产| 中文字幕A片无码免费看| 色播久久人人爽人人爽人人片av| 中文久久AV影院| 久久99国产精品成人欧美| 久久精品免视看国产成人| 国产亚洲AV电影院之毛片| 亚洲av熟女国产一二三| 无限A片| 成人国产精品秘片多多| 欧美精品国产制服第一页| 亚洲看片lutube在线入口| 国产精品麻豆中文字幕| 少妇午夜啪爽嗷嗷叫视频|