不兒,不兒,
一覺醒來四個(gè)好朋友的AI團(tuán)隊(duì)都進(jìn)騰訊了,數(shù)據(jù)分析,內(nèi)容編輯,視頻拆解,視頻生成的坑位都被占了,那我肯定也要來一把。
剛好最近我在狂用AI生成HTML PPT,把整套PPT生成工作流做成了WorkBuddy上Agent Team。
之前我比較苦惱的兩個(gè)點(diǎn)就是Claude太貴,所以我用的是GPT 5.5。但是GPT 5.5很喜歡在生成這個(gè)過程中,把自己的思考過程也塞PPT里,然后就會(huì)變成了一大堆你看著很不順眼的小字。
![]()
還有一個(gè)點(diǎn)就是,光用GPT Image2聯(lián)網(wǎng)生成的圖片素材還不是很夠。
有的時(shí)候頁數(shù)長了,我就覺得需要點(diǎn)視頻素材。
![]()
這是我用guizang-ppt-skill在Codex(GPT 5.5 High)做出來的PPT。
可以看出來,沒有用GPT Image2重新生成的圖是比例是真的丑,很多時(shí)候只有文字,我們需要更豐富的信息載體。這兩痛點(diǎn)已經(jīng)導(dǎo)致我這份PPT翻工了第四次了,
剛好借這個(gè)機(jī)會(huì),把我正在打磨的一個(gè)叫做Humanize PPT的Skill做成Agent,
簡單來說,它是一個(gè)內(nèi)容過濾層。
就像大家做前端,做App的時(shí)候,會(huì)想要參考類似于YC總裁 Garry Tan的Office Hour一樣,我在做HTML PPT的時(shí)候,也參考了TED上不同人做PPT的共同特點(diǎn),總結(jié)出了一個(gè)AST(Audience-State-Transfer|聽眾狀態(tài)轉(zhuǎn)移)理論。
![]()
用人話說,就是說在做 PPT 之前,AI需要自己回答清楚兩個(gè)問題:
- 這個(gè)PPT的受眾是誰?
- 在演講過程中,觀眾在看上一頁和下一頁,會(huì)產(chǎn)生什么樣的改變,他們?yōu)槭裁磿?huì)繼續(xù)聽下去。
這就是我之前聽TED演講時(shí)最深的一個(gè)感受,PPT對他們而言,能夠起到在關(guān)鍵節(jié)點(diǎn)展現(xiàn)信息的作用,同時(shí)又不會(huì)太搶戲。
也就是說,這樣做出來的 PPT是適合演講的。
以這里為例,
就是讓聽眾從一個(gè)完全不會(huì)WorKBuddy的人,變成一個(gè)知道怎么用WorKBuddy養(yǎng)龍蝦的人。
Humanize PPT會(huì)根據(jù)用戶狀態(tài)的改變來搭建整體目錄。這樣就不會(huì)出現(xiàn)我們給Agent一大堆參考文件后,它只會(huì)傻傻地按我給的順序來輸出。
相反,Agent需要把所有資料聚合,重新思考整個(gè)過程并進(jìn)行排列,去掉中間無意義的廢話,再把這個(gè)梳理好的大綱交給下游的PPTSkill。
所以我跟常用的2個(gè)HTML PPT Skill(guizang-ppt-skill和frontend-slides)和Remtion,Hhyperframes兩個(gè)視頻制作skill一排即合,做出了一個(gè)Agent團(tuán)隊(duì)。
![]()
PS:額外花10s介紹介紹單用這幾個(gè)Skill能做出來的效果
![]()
guizang-ppt-skill和frontend-slides
Remtion和有圖片素材下的Hyperframes
跟我在X上看到的那些比較完善,還帶放大縮小和鏡頭移動(dòng)效果的視頻有點(diǎn)出入,
但這確實(shí)是這兩個(gè)Skill在沒有經(jīng)過任何調(diào)優(yōu),只靠一句話做出來的真實(shí)效果。
它們組合成團(tuán)隊(duì)之后做出來的PPT長這樣,
![]()
還帶說明視頻和演講稿,
我要做的就是把網(wǎng)址以及截了個(gè)圖告訴他,我想把這個(gè)網(wǎng)頁里內(nèi)容A到內(nèi)容B中間的東西抽成 PPT,就那么簡單。
![]()
以前的做法是單個(gè)Agent放盡可能多的Skill,然后給它寫規(guī)則。
比方說在這里做PPT,我就會(huì)寫,
先用Humanize PPT把現(xiàn)有的材料轉(zhuǎn)成人能看懂的大綱,再用guizang-ppt-skill和frontend-slides做風(fēng)格探索,選到合適的PPT模版,再用Remtion和Hyperframes生成說明視頻才到PPT里,最后上傳成網(wǎng)頁,生成演講稿。
這樣的Workflow有一個(gè)缺點(diǎn),就是做到40頁左右的時(shí)候上下文限制啥都忘了,
大綱也忘了,風(fēng)格也忘了。
有了騰訊WorkBuddy的Agent專家團(tuán),我完全可以一個(gè)skill分給一個(gè)Agent。
主Agent就負(fù)責(zé)拆任務(wù),把任務(wù)分配給對應(yīng)的Skill Agent,其他Agent就同時(shí)開始做自己的部分,不占對方的上下文,也就是說,我們PPT生成有了大綱之后,頁面生成跟說明視頻其實(shí)可以同步做了。
![]()
在WorkBuddy上看的話,還可以在左側(cè)看到每個(gè)角色的輸出。如果你發(fā)現(xiàn)有一段不滿意的話,我們還可以進(jìn)行單獨(dú)的調(diào)整。
還能在小程序上直接看進(jìn)度,
![]()
當(dāng)然,它現(xiàn)在肯定還不是完美的。
還是會(huì)返工,會(huì)有視頻節(jié)奏的部份需要我來調(diào),
但這反而是我覺得真實(shí)的地方。
公司里的同事不也這樣。
你不會(huì)因?yàn)橐粋€(gè)設(shè)計(jì)師第一版沒做好,就說設(shè)計(jì)這個(gè)崗位沒價(jià)值了。
你會(huì)給反饋,會(huì)讓他重來一版。
AI團(tuán)隊(duì)也一樣。
這就是我理解的新一代一人公司。
是一個(gè)人開始擁有一套公司級的工作流。
以前你缺設(shè)計(jì)師,缺剪輯師,缺PM。
現(xiàn)在你可以擁有這些崗位的Agent角色。
額度多到用不完的話,
你還可以擁有一個(gè)專門盯著讓每頁P(yáng)PT都有視頻的同事。
這些判斷,過去都被壓在我身上,
我都快成7*24核動(dòng)力驢了,
現(xiàn)在終于可以拆出去一部分了。
如果你對WorkBuddy的新玩法感興趣,
他們現(xiàn)在都有20多個(gè)打包好的團(tuán)隊(duì)了,
今天這一輪跑下來,
我有一個(gè)很強(qiáng)的直覺。
一人公司這概念還會(huì)繼續(xù)火的。
@ 作者 / 卡爾
最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點(diǎn)贊|在看|轉(zhuǎn)發(fā)|評論
如果想要第一時(shí)間收到推送,不妨給我個(gè)星標(biāo)
如果你有更有趣的玩法,歡迎在評論區(qū)聊聊
更多的內(nèi)容正在不斷填坑中……
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.