![]()
作者 | Robert Krzaczyński
譯者 | 馬可薇
谷歌在 Gemini CLI 中引入了子代理(subagents)功能,這是一項(xiàng)新能力,旨在幫助開發(fā)者將復(fù)雜或重復(fù)性的任務(wù)委派給在主會(huì)話旁協(xié)同運(yùn)行的專用 AI 代理。
該功能允許主代理充當(dāng)“協(xié)調(diào)者”,將代碼分析、調(diào)研或測(cè)試等子任務(wù)分配給不同的專用子代理。每個(gè)子代理都在隔離環(huán)境中運(yùn)行,并將匯總后的結(jié)果返回主會(huì)話,從而減少上下文負(fù)載,并在長(zhǎng)時(shí)間交互過程中提升性能。
據(jù)谷歌介紹,這種方式旨在解決代理工作流中的常見問題,尤其是中間步驟不斷累積所帶來的響應(yīng)變慢和成本上升。通過將細(xì)粒度操作下放給子代理,主代理可以專注于更高層級(jí)的推理和最終結(jié)果輸出。
子代理還支持并行運(yùn)行,使多個(gè)任務(wù)能夠同時(shí)執(zhí)行。例如,開發(fā)者可以讓系統(tǒng)同時(shí)分析代碼庫(kù)的不同部分,或并行開展多項(xiàng)調(diào)研任務(wù)。雖然這有助于縮短整體執(zhí)行時(shí)間,但谷歌也指出,并行執(zhí)行可能帶來一些風(fēng)險(xiǎn),例如代碼修改沖突,以及由于并發(fā)請(qǐng)求導(dǎo)致的使用額度增加。
該功能的一個(gè)重要特點(diǎn)是高度可定制化。開發(fā)者可以通過帶有 YAML 配置的 Markdown 文件創(chuàng)建自定義子代理,從而定義其角色、可用工具以及行為規(guī)范。這些代理可以保存在本地或代碼倉(cāng)庫(kù)中,使團(tuán)隊(duì)能夠在項(xiàng)目間統(tǒng)一工作流或規(guī)范編碼實(shí)踐。此外,谷歌還提供了一些內(nèi)置子代理,例如通用助手、命令行(CLI)助手以及代碼庫(kù)分析代理。
系統(tǒng)還支持通過提示語語法進(jìn)行顯式任務(wù)委派,允許用戶直接將任務(wù)分配給特定代理。這使開發(fā)者能夠更精細(xì)地控制任務(wù)分發(fā),而不必完全依賴自動(dòng)路由機(jī)制。
這一發(fā)布凸顯了多代理架構(gòu)的發(fā)展趨勢(shì),即通過多個(gè)組件分別處理特定任務(wù),而不是依賴單一模型,從而在復(fù)雜開發(fā)流程中提升系統(tǒng)的可擴(kuò)展性和可維護(hù)性。
不過,早期用戶的反饋顯示,整體開發(fā)者體驗(yàn)仍有改進(jìn)空間。有評(píng)論指出當(dāng)前存在的一些問題:
谷歌應(yīng)當(dāng)在 gemini-cli 的穩(wěn)定性以及 UI/UX 上投入更多精力。目前即使是 Pro 版本,整體體驗(yàn)也相當(dāng)一般。模型本身表現(xiàn)不錯(cuò),但工具鏈還需要進(jìn)一步打磨。
盡管子代理的引入拓展了 Gemini CLI 的能力,其實(shí)際普及程度仍將取決于在功能迭代的同時(shí),相關(guān)可用性和穩(wěn)定性問題能否得到及時(shí)解決。
聲明:本文為 InfoQ 翻譯,未經(jīng)許可禁止轉(zhuǎn)載。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.