在24號凌晨,openai 官宣發布了最新的 GPT-5.5 模型。
![]()
在代碼能力評估層面的幾個關鍵指標:Terminal-Bench 2.0 (終端 agent 能力),OSWorld-Verified(電腦使用)和 BrowseComp(agent 瀏覽能力)等幾個指標上,GPT-5.5 相比于 GPT-5.4 都有了明顯提升,更是超過了競爭對手 Claude opus 4.7。
![]()
![]()
有網友在深度評測之后表示,GPT-5.5 終于學會了說人話,不再是整天穩穩地接住你……
![]()
然而,就在我寫文章的時候,突然又看到了一則重磅消息:DeepSeek 推出了 V4 的預覽版!
![]()
1M 長上下文,開源,api 價格比 GPT 和 Claude 便宜 10 倍以上,更重要的是開源。
根據官方報告中的描述,DeepSeekV4-pro 性能比肩頂級閉源模型。
![]()
對于在編程領域的差距,官方也毫不諱言:
![]()
其實 DeepSeek 在編程能力上的表現一直沒有被太多關注,更多地還是當做是一個綜合模型來使用。
所以這一次 DeepSeekV4 繼續發揮特長,加強了模型 agent 專項能力,針對Claude Code、OpenClaw等主流 agent 產品都做了適配和優化,是的你沒看錯,你的Claude Code背后也是可以接 DeepSeek 的,還貼出了一個生成 PPT 的例子。
唯一美中不足有點遺憾的是,DeepSeekV4 仍然不支持多模態,沒有讀圖和讀取文檔的能力。非常希望 DeepSeek 下一個版本能夠加上,這樣不僅在編碼上的體驗更好,而且模型的應用范圍也會更廣。
![]()
和 GPT/Claude 動輒 5 刀的價格比起來,即便是最貴的 DeepSeekV4-pro,也算得上是白菜價了……
![]()
相比于模型能力的提升,評估的分數,更有意義的其實是下面這件事:
DeepSeekV4 跑通了華為的昇騰芯片,或許對于英偉達的依賴,真的將要結束了。
![]()
最后,用 DeepSeek 技術報告的結尾來收尾吧。
「不誘于譽,不恐于誹,率道而行,端然正己。」 感謝每一位用戶的信任與支持,大家的肯定、建議和期許,是我們不竭探索、持續進步的動力,也讓我們始終堅守初心,專注于不懈的創新。 我們將始終秉持長期主義的原則理念,在嘗試與思考中踏實前行,努力向實現 AGI 的目標不斷靠近。
有夢想的人真的了不起,致敬!
claude code 中轉 :www.claudeide.net/zh
codex 中轉(已上線 gpt5.5):www.codeilab.com/zh
claude/codex 中轉,按量計費(1 元/刀):www.codebyai.net/zh
GPT5.4/Nano banana 無魔法網頁版,無限量包月使用:
https://fe.dtyuedan.cn/shop/WFGIXZEL
來源 | Coder梁(ID:Coder_LT)
作者 | 梁唐 ; 編輯 | 呼呼大睡
內容僅代表作者獨立觀點,不代表早讀課立場
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.