![]()
AI應(yīng)用風(fēng)向標(biāo)(公眾號:ZhidxcomAI)
作者|畢偉豪
編輯|漠影
智東西5月22日報道,今早,OpenAI發(fā)布了Codex的六項(xiàng)更新,包括Mac鎖屏后用手機(jī)遠(yuǎn)程操控、Appshots應(yīng)用截圖、目標(biāo)模式、應(yīng)用內(nèi)瀏覽器注釋、團(tuán)隊(duì)插件共享以及改進(jìn)企業(yè)分析功能。
![]()
此次更新最引人注目的是手機(jī)操控鎖屏Mac以及Appshots應(yīng)用截圖兩項(xiàng)功能,即使Mac已鎖定且屏幕關(guān)閉,Codex也可以通過手機(jī)安全地使用Mac上的應(yīng)用程序。同時,用戶可以使用Appshots功能,讓Codex自動捕獲前臺的應(yīng)用窗口的畫面,無需截圖和復(fù)制。
這些更新核心指向的是:讓Codex知道用戶在看什么,并在用戶離開電腦后接著把活干完。明顯能感受到的是,Codex正在和Claude Code、Cursor等AI工具一樣,“卷”起了開發(fā)效率,想盡一切辦法讓使用更方便。
一、鎖屏也能操控整個電腦,人走了Codex還能干活
啟用“鎖定電腦使用”功能后,Mac用戶在電腦鎖定后,可以繼續(xù)遠(yuǎn)程安全地使用Codex,也就是說用戶可以在電腦處于鎖定狀態(tài)下讓Codex繼續(xù)工作,無需保證電腦時刻保持打開狀態(tài)。
![]()
這項(xiàng)功能并非傳統(tǒng)的遠(yuǎn)程解鎖,也不會允許其他應(yīng)用程序或本地進(jìn)程解鎖電腦。
當(dāng)Codex在Mac鎖定后通過“電腦使用”訪問應(yīng)用程序時,Codex會暫時解鎖Mac,同時阻止本地使用并保留屏幕鎖定。解鎖前,Codex會短暫檢查解鎖嘗試是否源自活躍的、受信任的電腦。如果超出此短暫窗口期,Codex將拒絕解鎖,并提示用戶根據(jù)需要手動解鎖。
Codex還為鎖定使用設(shè)置了以下安全措施:
1、授權(quán)窗口持續(xù)時間很短,僅限于當(dāng)前的解鎖嘗試。
2、自動解鎖功能僅在Codex處于常用活躍計算機(jī)使用狀態(tài)時可用。
3、Codex會遮蓋所有顯示屏,防止信息泄露。
4、如果Codex檢測到本地鍵盤或指針輸入,它會重新鎖定Mac并暫停自動解鎖,直到用戶手動解鎖為止。
二、不用截屏和復(fù)制,一鍵自動截圖、提取文字,絲滑導(dǎo)入Codex
Appshots功能支持用戶將前臺最上方的應(yīng)用程序窗口發(fā)送到Codex中,當(dāng)用戶正在使用另一個應(yīng)用程序時,可以同時按左右Command鍵,Codex會自動截取當(dāng)前窗口上的可見圖像、提取可見文本以及可見區(qū)域之外的文本,提取后Codex會將圖像和文本存儲在本地會話文件中,就像手動添加的文件或圖像一樣。
![]()
適用場景很實(shí)在,OpenAI給出的例子包括:分享API參考頁面讓Codex寫腳本、分享郵件或日歷頁面讓Codex起草下一步、分享設(shè)計稿窗口讓Codex修改對應(yīng)資源或代碼、分享報錯面板或設(shè)置頁面讓Codex排查問題。
一句話總結(jié),凡是打字不如貼圖的場景,Appshots都能省掉用戶描述環(huán)節(jié)。
Codex需要在屏幕和系統(tǒng)音頻錄制功能,以及輔助功能中開啟權(quán)限才可以使用,此外Appshot只能看到可見的屏幕截圖,無法接收完整的文檔。
三、一人做插件,全公司都能用
對于企業(yè)用戶來說,此次更新有兩個非常便利的功能:團(tuán)隊(duì)共享插件和使用情況分析優(yōu)化。
企業(yè)用戶可以將自己的插件共享給團(tuán)隊(duì)使用,團(tuán)隊(duì)內(nèi)部可以重復(fù)使用已有工具以及管理可用資源,這一功能可以更好地實(shí)現(xiàn)團(tuán)隊(duì)協(xié)作,提高效率。
同時,OpenAI改進(jìn)了Codex中面向企業(yè)和公司的分析功能,企業(yè)可以獲取包括活躍用戶、Token用量、調(diào)用次數(shù)、運(yùn)行狀況、代碼行數(shù)、用戶排行以及插件使用情況這些數(shù)據(jù),便于企業(yè)進(jìn)行管理。
四、目標(biāo)模式正式上線:讓Codex執(zhí)行任務(wù)不再跑偏
目標(biāo)模式是Codex提供的一種長效工作模式,它賦予Codex一個具有明確完成標(biāo)準(zhǔn)的持久目標(biāo),讓用戶可以將復(fù)雜、多步驟的任務(wù)放心地交給它獨(dú)立推進(jìn)。
與普通的單輪提示不同,目標(biāo)模式是一個貫穿整個會話的行動綱領(lǐng)。用戶需要輸入/goal命令,然后提供起始文本和完成標(biāo)準(zhǔn),讓Codex知道從哪里開始以及什么情況算是完成。![]()
設(shè)定目標(biāo)后,Codex會自動循環(huán)執(zhí)行”規(guī)劃、執(zhí)行、自檢”的流程,持續(xù)判斷下一步該做什么、離目標(biāo)還有多遠(yuǎn),直到達(dá)成用戶定義的完成標(biāo)準(zhǔn)。
如果目標(biāo)難以預(yù)先明確,用戶可以先鍵入/plan讓Codex協(xié)助完善目標(biāo),然后再繼續(xù),也可以讓Codex進(jìn)行詢問,共同制定包含清晰成功標(biāo)準(zhǔn)的目標(biāo)。
目標(biāo)模式啟動后,用戶可以繼續(xù)操控Codex,發(fā)送后續(xù)消息來調(diào)整限制條件,例如要求Codex使用特定庫或避免使用特定方法。如果用戶需要狀態(tài)回顧或解釋,但又不想中斷主任務(wù),可以使用側(cè)邊聊天功能。對于長時間運(yùn)行的任務(wù)想要暫停時,需要在網(wǎng)絡(luò)連接中斷前暫停目標(biāo),然后在準(zhǔn)備好繼續(xù)時恢復(fù)。
五、瀏覽器高級注釋,標(biāo)注哪里改哪里,支持實(shí)時預(yù)覽
瀏覽器方面的改進(jìn)集中在兩點(diǎn):內(nèi)置瀏覽器本身的能力升級,以及注釋交互的精細(xì)化。
內(nèi)置瀏覽器現(xiàn)在支持高級注釋模式。打開注釋模式后,選中頁面元素或區(qū)域,直
接提交反饋,Codex會根據(jù)注釋定位問題。按住Shift點(diǎn)擊可以選擇區(qū)域,按住Cmd點(diǎn)擊則是直接發(fā)送注釋。
一個很有意思的功能是樣式反饋,在注釋輸入框旁邊有個配置圖標(biāo),點(diǎn)開后可以調(diào)整字體、文本、間距、顏色等樣式值,能直接在頁面上預(yù)覽改動效果,設(shè)計師和開發(fā)人員可以準(zhǔn)確地預(yù)覽他們想要更改的內(nèi)容。
![]()
結(jié)語:六大更新,Codex在追求極致效率和保證安全的權(quán)衡中前進(jìn)
這些更新放在一起看,邏輯很清晰:Appshots解決“怎么讓AI更快更好地看到我的上下文”,目標(biāo)模式解決“怎么讓AI方向不跑偏”,瀏覽器注釋解決“怎么讓AI精確且方便地修改”,鎖定使用解決“怎么讓AI在用戶離開后繼續(xù)干活”。
這些串聯(lián)起來,再加上面向企業(yè)的更新,可以看到Codex正在朝著提高開發(fā)效率的方向不斷努力,在OpenClaw等一眾AI助手橫空出世后,Claude、Codex、Cursor等都在追求如何結(jié)合Agent為用戶打造更好的“幫手”,此次更新也正是OpenAI在這條路上的階段成果。
當(dāng)然,每一項(xiàng)都有硬約束。Appshots有權(quán)限限制和場景盲區(qū),目標(biāo)模式需要用戶定義清晰的成功標(biāo)準(zhǔn),鎖屏使用加了層層安全校驗(yàn)。這些邊界不是缺陷,是OpenAI給Agent行為打的防護(hù)欄,如何在保證安全的前提下發(fā)揮Agent更強(qiáng)大的能力,是所有廠商思考的方向。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.