<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      GPT-5.4發布,最適合OpenClaw的天選模型登場了。

      0
      分享至

      深夜凌晨2點,我剛準備睡覺。

      然后,GPT-5.4,突然發布。


      一下子激動的睡不著了。

      真的,這真不是我天天咋咋呼呼啥的,我真的也很少會用激動的睡不著覺這種表述。

      這是因為,我一直在等正式版的GPT-5.3或者GPT-5.4,來作為我的OpenClaw的首選模型。

      理由特別簡單,因為現代世界三十年,本質上基層都是代碼,我們現在看到的關于計算機和互聯網的一切,幾乎都建立在代碼的基礎之上。

      所以你可以理解為,代碼能力,在很多時候,就代表著Agent能力的一根粗壯的腿。

      一個優秀的Agent基座模型,在我的理解里,一般來說,需要三種都很強:

      代碼能力、世界知識、多模態理解。

      當你這三個都能SOTA的時候,你幾乎必然就是最牛逼的Agent模型,當然,還有一個重要的因素,就是價格。

      在過去,Claude Opus 4.6,幾乎就是Agent模型的代名詞,因為代碼、世界知識都很強,多模態能力雖然比不過Seed 2.0和Gemini 3.1 Pro,但是在一些場景里面,也夠了,因為現在的Agent,跟現實物理交互還沒有那么多,那個已經是具身智能的范疇了。

      而我過去很喜歡的GPT-5.3-Codex,代碼能力確實強,在做任務執行的時候,那簡直就是指哪打哪。

      但是最大的問題,這玩意是一個編程特化模型啊,世界知識就是一坨屎,連GPT-5.2都不如,所以OpenAI當時也是沒辦法,為了跟Claude打一打,只能加個Codex的后綴給放出來了。

      所以你會發現,在規劃能力上,是完全比不過Claude Opus 4.6的,但是最大的問題,其實還是因為世界知識的問題,就導致這玩意。

      它說天書,講的那些話,真的,我不是程序員出身,我看那個話,看的就真的超級費勁。

      就比如說,我讓他之前對我的一個AI熱點網站的項目進行審查,主要就是review一下我的文檔規范和我整個代碼庫。

      然后,這哥們寫的文檔,我尼瑪。。。


      你再對比一下Claude Opus 4.6寫的。


      對比起來應該一目了然。。。

      就是因為這玩意不說人話,世界知識也不行,所以,只是在Codex里面用用還好,但是你要是把它接到你的OpenClaw里面,去當做默認模型,你就知道啥叫災難了,這哥們幾乎沒有人味,說起話來我想揍他。

      所以我當時試了一下,就直接棄了,還是在我的OpenClaw里面,用的Claude Opus 4.6和Sonnet 4.6,做了一下場景調用。

      那為啥說,我很期待GPT-5.4呢。

      因為,Claude哪都好,但是,它貴啊!!!

      它真的好貴?。。。。。?!

      而且因為Anthropic這個呆逼,它把OpenClaw給瘋了,所以我訂閱的Claude的Max Plan的額度,是完全不能給OpenClaw用的,只能在Claude Code用,你想在OpenClaw上用,只能硬接API Key用。

      但是大家都知道,Claude的API有多貴,那根本不是我們這種窮逼團隊能用的起的,小規模用用還好,大規模用那公司直接破產了。

      之前還有一條路是用反代,把Google家的Antigravity里面的Claude額度用插件代理出來,扔給OpenClaw用。


      但是后面Google開始大批量封號,導致也沒辦法用了。

      我過年的時候Google賬號還被封了,被迫用AI去給Google寫了一份聲淚俱下的郵件。


      我說我錯了,我再也不會了。

      后面Google才給我解封,但是反代肯定是用不了了。

      而OpenAI就不一樣了,最開始Claude瘋狂封OpenCode賬號的時候,OpenAI大手一揮,就站了出來,說我們不封,大家全力使用。


      這是御三家里,唯一一個這么支持態度的,可以用第三方的工具,調用Codex的額度的。

      那對OpenClaw自然也不例外了,也是幾個頂級模型里面,為數不多的,可以直接走登錄的,其他的都得用API。


      真的,OpenAI這會真的是大善人。

      還瘋狂的給Codex加額度。


      所以啊,Claude在OpenClaw里用,好是好,但是不能用訂閱額度,只能用API,貴的一筆。

      OpenAI的模型倒是可以用訂閱額度,但是GPT-5.2代碼又不行,GPT-5.3-codex又不說人話。

      你看,要多別扭有多別扭。

      而這一次,GPT-5.4來了?。。?/p>

      終于把這個短板給補上了!

      代碼能力跟GPT-5.3-Codex齊平,世界知識比GPT-5.2還要強,還能使用訂閱額度,20刀就可以用的超級爽。

      你就說,這不是最適合OpenClaw的天選模型,還有誰是?嗯?

      從今天開始,用OpenClaw的,都把默認模型切換到GPT-5.4去,真的,信我。

      回到GPT-5.4,老規矩,先看跑分。


      就很爽。

      先看最關鍵的幾個。

      GDPval:83.0%

      這個是測AI在真實工作任務中表現的,包括金融、法律等44種職業的知識工作。

      GPT-5.4 Thinking拿了83.0%,Claude Opus 4.6是78.0%,GPT-5.3 Codex是70.9%。

      在真實業務場景里,GPT-5.4不只是會寫代碼,它還能跟你聊業務、聊金融、聊法律、聊各種專業領域的東西。

      而且是用人話聊,不是用天書聊。

      SWE-Bench Pro:57.7%

      這個是測AI解決真實軟件工程問題的,不只是Python,而是測四種編程語言。

      GPT-5.4 Thinking拿了57.7%,GPT-5.3 Codex是56.8%。

      基本持平。

      這就是我最想看到的結果。

      代碼能力保住了GPT-5.3 Codex的水平,世界知識又補上來了。

      OSWorld-Verified也是,75.0%。這個是測AI操作電腦的能力的,就是讓AI像人一樣,用鼠標點擊、用鍵盤輸入、在不同應用之間切換,完成各種任務。

      GPT-5.4 Thinking拿了75.0%,超過了Claude Opus 4.6的72.7%,也保持了跟GPT-5.3-Codex的持平。

      而且,GPT-5.4操作電腦的速度,快的離譜。


      看下這個沒有加速過的視頻,會更直觀。

      ToolAthon:54.6%

      這個是測AI使用工具的能力的,也就是Agent能力的核心指標之一。

      GPT-5.4 Thinking拿了54.6%,Claude Opus 4.6是44.8%。

      差了將近10個點。

      至于學術知識之類的,跟GPT-5.3-codex就沒法比了,因為OpenAI自己也知道,所以,直接當時就沒跑。


      總之,翻譯成大白話就是。

      GPT-5.4 = GPT-5.3 Codex的代碼能力 + 比GPT-5.2還強的世界知識 + 更強的工具使用能力 + 超級便宜的codex額度。

      這四樣加在一起,就是一個完美的OpenClaw天選基座模型。

      然后還有幾個很棒的特性更新:

      1. 100萬token的上下文窗口。

      這是GPT-5.4的一個大升級。

      之前GPT-5.3的上下文窗口是40萬token,GPT-5.4直接翻了一倍多,到了100萬。

      這對Agent來說太重要了。

      因為Agent在執行任務的時候,需要保持對整個任務的上下文理解。如果上下文窗口不夠大,Agent干著干著就會忘事兒,前面說的東西后面就不記得了。

      100萬token,基本上足夠應對絕大部分的Agent任務了。

      當然,OpenAI也不傻,他們說,超過27萬token之后,你的額度就算兩倍了。


      不過因為Codex給的額度實在是太多太多了,所以即使是2倍,其實也還好。

      2. 原生計算機使用能力。

      這個是GPT-5.4的另一個大賣點。

      OpenAI說,GPT-5.4是他們第一個內置原生計算機使用能力的主線模型。

      它在編寫通過Playwright等庫操作計算機的代碼方面表現非常的出色,同時也能根據屏幕截圖發出鼠標和鍵盤命令。

      也就是代碼和視覺齊飛,我感覺,這個小龍蝦接入以后,就真的可以,直接用視覺,操控你電腦上絕大多數的軟件了,真的,原生操控,想想都激動。

      他們基于此,還發布了一個新的skills,叫playwright-interactive。

      允許Codex同時以代碼和視覺的兩種方式,調試Web和Electron應用。


      網址在此,大家可以自行安裝。

      https://github.com/openai/skills/tree/main/skills/.curated/playwright-interactive

      3. 支持了工具搜索。

      以前呢,當模型被賦予工具時,所有工具定義都會預先包含在提示中。

      對于擁有大量工具的系統,這可能會為每個請求增加數千甚至數萬個token,而且絕大多數的時候,都毫無意義,平白無故的導致成本上升、響應變慢,并在上下文中充斥模型可能永遠不會使用的信息。

      所以呢,這次他們也支持了工具搜索,就是GPT?5.4不再直接接收完整工具定義,而是接收一份可用工具的輕量列表以及工具搜索功能。

      當模型需要使用某個工具時,它可以查找該工具的定義并在當時將其追加到對話中。

      就非常像Skills漸進式呈現的方式,目的很簡單,還是優化上下文工程。

      OpenAI在自己測試完以后,發現工具搜索配置在保持相同準確率的同時將總體token使用量減少47%,這個就非常牛逼了。


      GPT-5.4 Thinking大概就是這樣。

      這次他們其實還發了個GPT-5.4 Pro,我就不細說了,反正就是一切都更牛逼了,但是對于大多數人來說,太貴了,也沒啥大用,必須得200刀的Pro會員才能用。

      API的整體價格還是得說一下,雖然大家大概率用的都會是訂閱的額度。


      相比于GPT-5.2,價格是漲了的,但是還是比Claude Opus 4.6,便宜不少,Claude Opus 4.6的價格是$5/$25每百萬token(輸入/輸出),GPT-5.4只有他們一半。

      目前ChatGPT已經上線了。


      Codex也已經支持了,我自己在Codex里面粗淺體驗了一下。


      首先撲面而來的,那自然是清新沁人的人話。。。

      比如我讓它去把OpenAI官網的視頻給扒拉下來,你看看這個發言:“這種活最煩”,“省的跟Cloudflare互相折壽”。。。


      還有這個。

      真的,Codex的輸出,我真的能看得懂了。。。


      做出來的東西,前端審美有了不錯的進步,但還是不如Opus 4.6和Gemini。


      寫作粗略測了一下,還是一股子莫名其妙的愛用排比句的詭異的味道。

      奇奇怪怪。

      然后有點可惜的就是,我等到了凌晨6點多,OpenClaw目前使用Codex登錄的方式,還是沒有支持GPT-5.4。


      這就導致,我還是沒有機會測GPT-5.4在小龍蝦上的效果。

      不過估計我一覺睡醒,估計小龍蝦就支持了。

      因為社區里已經看到很多用戶在催了,而且先行官們,都普遍反饋效果很好。

      坐等支持,我真的已經迫不及待了。

      又是開心的一晚。

      如果你也在用OpenClaw,那記得OpenClaw支持了以后,把默認模型切換到GPT-5.4。

      如果你還沒用過OpenClaw,那正好,現在是一個很好的開始時機。

      畢竟,有了GPT-5.4這個天選模型,體驗只會更好。

      2026年,真是瘋狂的一年啊。

      睡了。

      以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。

      >/ 作者:卡茲克

      >/ 投稿或爆料,請聯系郵箱:wzglyay@virxact.com

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      5月最不好惹的3個生肖:別人虧時候他們賺,別人賺時候他們多賺!

      5月最不好惹的3個生肖:別人虧時候他們賺,別人賺時候他們多賺!

      毅談生肖
      2026-05-15 11:49:53
      丈夫:你把工資拿娘家,兒子用啥?妻子:侄子都養了,兒子也能養

      丈夫:你把工資拿娘家,兒子用啥?妻子:侄子都養了,兒子也能養

      惟來
      2026-05-14 12:02:01
      突然強勢拉升!外交部就特朗普訪華情況答記者問,科創芯片ETF(588290)上漲1.32%

      突然強勢拉升!外交部就特朗普訪華情況答記者問,科創芯片ETF(588290)上漲1.32%

      每日經濟新聞
      2026-05-15 11:24:39
      男子酒后執意要開車,女友勸阻無效后下車走人,警方調查發現其并非第一次酒駕,已被刑事立案偵查

      男子酒后執意要開車,女友勸阻無效后下車走人,警方調查發現其并非第一次酒駕,已被刑事立案偵查

      極目新聞
      2026-05-14 22:36:50
      深夜,暴漲超43%!大牛股,突傳利好!

      深夜,暴漲超43%!大牛股,突傳利好!

      證券時報
      2026-05-15 00:13:10
      特斯拉推出“輕松貸” 五年月供可低至約2193元

      特斯拉推出“輕松貸” 五年月供可低至約2193元

      太平洋汽車
      2026-05-15 12:34:15
      醫生不會告訴你的秘密:這個部位越敏感,性生活越和諧

      醫生不會告訴你的秘密:這個部位越敏感,性生活越和諧

      精彩分享快樂
      2026-05-15 12:11:32
      有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

      有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

      夜深愛雜談
      2026-02-18 20:55:58
      日媒質疑國乒使詐,主帥點出王曼昱孫穎莎差距,梁靖崑獲三萬獎金

      日媒質疑國乒使詐,主帥點出王曼昱孫穎莎差距,梁靖崑獲三萬獎金

      三十年萊斯特城球迷
      2026-05-14 23:13:04
      1985年,國安叛徒藏身南美,中國6名兵王萬里鋤奸,FBI顏面盡失

      1985年,國安叛徒藏身南美,中國6名兵王萬里鋤奸,FBI顏面盡失

      干史人
      2026-04-14 21:10:03
      季后賽報銷!太陽決定交易!排隊給湖人道歉

      季后賽報銷!太陽決定交易!排隊給湖人道歉

      籃球教學論壇
      2026-05-15 11:23:11
      俄羅斯又開始許愿,要求烏克蘭撤出“俄羅斯領土”

      俄羅斯又開始許愿,要求烏克蘭撤出“俄羅斯領土”

      山河路口
      2026-05-13 20:35:10
      故宮留面子,天壇亮底線!特朗普訪華地大變,暗藏中國的大國格局

      故宮留面子,天壇亮底線!特朗普訪華地大變,暗藏中國的大國格局

      小小科普員
      2026-05-14 20:24:25
      中美會談結束,特朗普用4字評價,美媒發現:中國這次話說的很重

      中美會談結束,特朗普用4字評價,美媒發現:中國這次話說的很重

      尋墨閣
      2026-05-15 01:15:17
      里程全國第一,卻有30余縣“手無寸鐵”:廣東高鐵的繁華與盲區

      里程全國第一,卻有30余縣“手無寸鐵”:廣東高鐵的繁華與盲區

      普陀動物世界
      2026-05-14 11:47:14
      漢語是犧牲了什么,才成為世界最緊湊、最高效的語言?

      漢語是犧牲了什么,才成為世界最緊湊、最高效的語言?

      瓜哥的動物日記
      2026-05-13 00:58:37
      僅僅因為一個枕頭,性生活發生了翻天覆地的變化

      僅僅因為一個枕頭,性生活發生了翻天覆地的變化

      精彩分享快樂
      2026-05-15 12:07:56
      何炅工作室回應:沒通知我們啊

      何炅工作室回應:沒通知我們啊

      南方都市報
      2026-05-14 17:49:25
      乒乓球全錦賽延期!原因:與王楚欽和孫穎莎有關,球迷力挺王勵勤

      乒乓球全錦賽延期!原因:與王楚欽和孫穎莎有關,球迷力挺王勵勤

      老王大話體育
      2026-05-15 12:19:44
      97年我對女老師說我喜歡她,她紅著臉說:考上重點大學我就嫁給你

      97年我對女老師說我喜歡她,她紅著臉說:考上重點大學我就嫁給你

      千秋文化
      2026-05-02 19:36:54
      2026-05-15 13:11:00
      數字生命卡茲克 incentive-icons
      數字生命卡茲克
      反復橫跳于不同的AI領域,努力分享一些很酷的AI干貨
      517文章數 648關注度
      往期回顧 全部

      科技要聞

      兩年聯姻一地雞毛,傳蘋果OpenAI瀕臨決裂

      頭條要聞

      歡迎宴會座位公開:馬斯克黃仁勛與中國企業家同桌吃飯

      頭條要聞

      歡迎宴會座位公開:馬斯克黃仁勛與中國企業家同桌吃飯

      體育要聞

      德約科維奇買的球隊,從第6級聯賽升入法甲

      娛樂要聞

      方媛回應住男生單人間:女孩的配得感

      財經要聞

      特朗普的北京時刻

      汽車要聞

      雙零重力座椅/AI智能體/調光天幕 啟境GT7內飾發布

      態度原創

      藝術
      本地
      健康
      數碼
      公開課

      藝術要聞

      一個北大 “反卷教授” 的意外走紅

      本地新聞

      用蘇繡的方式,打開江西婺源

      專家揭秘干細胞回輸的安全風險

      數碼要聞

      佰維M560靈梭SSD評測:單面顆粒+5.2W低功耗,筆記本擴容實力之選

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产欧美日韩免费看AⅤ视频| 日本一区二区精品视频| 最新国产麻豆AⅤ精品无码| 精品久久久久久中文字幕202| 国产成人精品午夜福利在线播放| 2019最新免费v片?精品亚洲| 夜夜撸天天操| 亚洲欧美日韩在线网| 内射老妇bbwx0c0ck| 国产乱精品一区二区三区| 久久精品视频18| 亚洲国产永久精品成人麻豆| 亚洲国产字幕| 天堂a无码a无线孕交| 熟女人妻精品一区二区视频| 日韩激情成人| 久久精品日日躁夜夜躁| 国产粗大| 亚洲人成色777777老人头| 老湿视频国产二区| 国产成人久久精品激情91| 内射中出高清晰| 亚洲人成电影在线天堂色| 午夜福利激情一区二区三区| 鲁鲁鲁鲁鲁鲁鲁777777| 一级国产在线观看高清| 99精品全国免费观看视频| 国产一级视频在线观看网站| 国产精品18| 4hu44四虎www在线影院麻豆| 麻豆久久久9性大片| 超碰人人摸| 亚洲人成亚洲人成在线观看| 国产又猛又爽又黄视频| 久久这里有精品国产电影网| 亚洲熟女视讯2| 777奇米四色成人影视色区| av在线播放无码线| 91视频免费入口| 成人久久久久久久久久久| 香港aa三级久久三级|