昨晚我就有個預(yù)感,覺得 OpenAI 可能要放點大招了。
結(jié)果,我半夜起來上廁所時看了一眼手機,GPT-5.5 發(fā)布了,頓時睡意全無。
光看過去一周時間,全世界這些頂級 AI 公司都是模型連發(fā),根本應(yīng)接不暇,或許留給人類的智力空間真的在縮小。
![]()
目前,GPT-5.5 已經(jīng)可以在 ChatGPT 和 Codex 里用了,但需要 Plus 以上的會員。
也就是說,你至少需要花 20 美金一個月的價格才能體驗到這個可能是目前最強的 AI 模型。
我第一時間用了下,感受就是它的確很強,但并不是我自己覺得目前最好用的。
我先說下它到底哪里強,然后再給你們看幾個我自己用 GPT-5.5 做的案例。
在 OpenAI 介紹 GPT-5.5 的官網(wǎng)上,他們在模型底下寫上了這么一句話「A new class of intelligence for real work」。
![]()
意思很明顯了,這是專為解決真實工作問題而生的新一代智能模型。
怎么理解呢?
用大白話說,就是 GPT-5.5 在完成工作任務(wù)上的效率比其他模型更高,而成本反而會更低。
先看官方發(fā)布的一個多領(lǐng)域測試榜單,不理解那些英文沒關(guān)系,你只要知道這里面基本涵蓋了日常工作、科研、工具使用的方方面面。
重點看 GPT-5.5 和 Claude Opus 4.7 的對比,因為這就是巔峰比拼。
![]()
可以看到,GPT 基本是完勝 Claude 的。
我就挑幾個跟我們普通打工人有關(guān)的測試來跟你們說下,看看 GPT-5.5 到底有多強。
下面這個是一個叫 GDPval 的測試,它模擬的是讓 AI 在 44 個職業(yè)領(lǐng)域中完成知識型工作,GPT-5.5 的得分是 84.9%。
![]()
還原到現(xiàn)實工作場景中,意思就是使用這個模型來完成各領(lǐng)域的知識型工作的能力會更強。
比如,產(chǎn)品經(jīng)理分析需求、做競品報告、做原型設(shè)計、分析數(shù)據(jù),創(chuàng)作者做內(nèi)容,財務(wù)分析以及文檔寫作、PPT設(shè)計等。
再就是 GPT-5.5 的編碼能力。
你們可能會好奇,為什么每家 AI 大廠發(fā)新模型是都喜歡強調(diào)自己的編碼能力?
其實很簡單,因為編程往往是解決復(fù)雜問題,這能很好考察模型的問題分析、路徑規(guī)劃、方案執(zhí)行能力,還有就是解決問題的成功率。
過去有些模型是很強,也能編程,但是需要人和它互動調(diào)教很多次才能搞定。
現(xiàn)在的新 AI 模型,講究的是自我分析、自我規(guī)劃、自我執(zhí)行,人為的干預(yù)越少越好。
GPT-5.5 現(xiàn)在主打的 Agentic Coding 就是這個意思,說白了就是讓 AI 自己干。
在官網(wǎng)給出的測試基準里,5.5 是全面超過之前的 5.4 版本的。
![]()
當然,還有一個原因,就是編碼工作是為 AI 付費的一大主流場景。
GPT-5.5 里還有一個重要信息,就是在完成特定任務(wù)的基礎(chǔ)上,消耗 Token 和 5.4 持平,但是效率和成功率更高。
這么一來,實際消耗的 Token 是減少的,因為過去你可能需要多輪會話才能搞定一件事,現(xiàn)在一次就可以搞定了。
還有,GPT-5.5 的工具調(diào)用和對電腦的視覺化操作能力也是目前最強的。
![]()
尤其是對電腦的視覺化操作,這是未來 Agent 來替我們完成實際工作的很重要的標準。
也就是說,如果給 OpenClaw 或者 Hermes 配上 GPT-5.5 的模型,他們替你干活的能力又提升了。
![]()
說了這些榜單和能力,接下來我們看幾個案例。
這是 OpenAI 自己做的一個案例,上傳了一張參考圖,然后讓 GPT 自己做一個基于真實數(shù)據(jù)的太空軌跡應(yīng)用,里面展示了地球、月球、獵戶座的動效軌跡。
![]()
提示詞:Implement this as a new app using webgl and vite using real data from the artemis II mission. Make sure to test the app thoroughly until it is fully functional and looks like the app in the picture. Pay close attention to the rendering of the planets and fly paths. I want to be able to interact with the 3D rendering. Ensure it has realistic orbital mechanics.
我覺得,這個做出來的效果還是挺強的。
然后再給你們看一下我自己用 GPT-5.5 做的一套高保真原型圖,而且是帶頁面交互效果的。
原始需求就是我的一句話。
提示詞:設(shè)計一套關(guān)于健康管理App的高保真原型頁面,帶交互,產(chǎn)品名字是EasyLife,核心功能包括注冊、登錄、主頁、個人身體數(shù)據(jù)顯示,包括一些圖表等。設(shè)計風格帶圓角,整體簡潔風。
注意,在這段需求里,我既沒有說詳細業(yè)務(wù)邏輯,也沒有描述功能模塊,甚至單一模塊的邏輯都沒說。
丟給它自己分析、設(shè)計、執(zhí)行,然后把前端代碼也寫好了。
![]()
這里面還有一個細節(jié),我的原始需求里其實沒有「活動」和「報告」兩個模塊,但它開發(fā)出來的版本里默認帶了,只不過頁面是空的。
我點擊的時候會提示該頁面暫未開發(fā),于是我就跟它說了這句話。
![]()
大概一兩分鐘后,它就給了我一版完整的,就是上面你們看到的那樣。
如果看過我之前文章的讀者,或許對這個案例有點印象,就是我去年減脂期間用其他 AI 產(chǎn)品手搓過的一個 App。
只不過當時折騰了很久,而且出來的效果不太好,現(xiàn)在 GPT-5.5 這個效果我覺得可以直接用了。
關(guān)鍵是,沒有多輪會話,基本是一兩步就完成了。
回到我一開始說的,GPT-5.5 確實很強,或者說就是目前最強的 AI 模型,但對我來說它不是最好用的。
原因很簡單,取決于你在什么場景下用它來干嘛?
也就是說,你的工作流是什么。
對我來說,內(nèi)容創(chuàng)作、產(chǎn)品設(shè)計、咨詢業(yè)務(wù),這些是我已經(jīng)形成工作流的,所以我也用 5 個正職 AI 員工實現(xiàn)了自動化。
這一點,我在昨天的文章里講了。
![]()
但是,在這些工作流里并沒有一個全能模型可以勝任所有工作。
所以,我是在不同場景和需求任務(wù)下讓不同的 Agent 配不同的模型使用,就像雇有不同腦子和能力的人一樣。
比如,在內(nèi)容輔助創(chuàng)作這一塊,我覺得目前最強的還是 Claude Opus 4.6,在 Agent 事務(wù)處理和本地化操作上,GPT-5.4 是我主要用的。
當然,接下來我有可能切換為 GPT-5.5,但考慮性價比的話,5.4 還是更合適。
在產(chǎn)品類工作上,我覺得 Claude 和 GPT 的表現(xiàn)其實差不太多,但 Claude 性價比就不是很高了。
我也用國產(chǎn)模型,一些事務(wù)型的工作或者 AI 團隊調(diào)度管理類的,我現(xiàn)在用 Kimi 和 MiniMax 比較多,還有就是 GLM。
其實不管你用什么模型,核心還是我前面說的,有沒有自己的工作流可以讓 AI 接入。
如果只是用 AI 來查查信息,聊聊天,其實用什么區(qū)別都不大。
我知道現(xiàn)在 AI 發(fā)展很快,很多人也會焦慮,但這種情緒并沒有什么用,關(guān)鍵是要想清楚你可以用 AI 來干嘛?
每次打開那個對話框,發(fā)現(xiàn)自己無所適從時,我覺得這才是真正值得深思的。
這個時代發(fā)展的速度只會越來越快,讓很多人焦慮的不是技術(shù)的進展,而是自己跟不上的那個節(jié)奏。
核心問題,在于傳統(tǒng)思維和認知的受限,以及信息差的存在,再加上行動能力的匱乏。
或許你們也發(fā)現(xiàn)了,我最近更新文章的頻率很高,有時候甚至是一天寫兩篇。
不是我時間變多了,而是我把自己放在這一輪的發(fā)展進程中,而且有了一個 AI 團隊。
我不想錯過,所以投入。
正當我寫完這篇文章時,AI 圈又發(fā)生了一件大事。
DeepSeek V4,來了!
或許,我在這篇文章里剛剛才得出的一些結(jié)論,又要被推翻了。
················· 唐韌出品 ·················
安可時刻
現(xiàn)在如果你們想使用 GPT-5.5 的,可以在ChatGPT里直接用,也可以在 Codex 里用,最新模型已經(jīng)默認是 5.5 了。
![]()
如果你們已經(jīng)有了自己的常用 AI 對話類產(chǎn)品,比如 Youmind 這類的,他們也會很快接入。
如果是像我一樣主要用 OpenClaw 和 Hermes 這類智能體的,一些 API 中轉(zhuǎn)平臺也已經(jīng)在接入了,估計這兩天就能用上。
我準備給其中一個 AI 員工從原來的 GPT-5.4 升級為 5.5,雖然貴一點,但我還是會深度體驗測試一下。
最后,如果你不知道怎么擁抱這一輪時代級的機會,可以看看我昨天的文章。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.