網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

我的一人公司AI PPT團(tuán)隊(duì)，也被騰訊錄用了

2026-05-15 14:47:30　來源: 卡爾的AI沃茨

北京舉報(bào)

分享至

不兒，不兒，

一覺醒來四個(gè)好朋友的AI團(tuán)隊(duì)都進(jìn)騰訊了，數(shù)據(jù)分析，內(nèi)容編輯，視頻拆解，視頻生成的坑位都被占了，那我肯定也要來一把。

剛好最近我在狂用AI生成HTML PPT，把整套PPT生成工作流做成了WorkBuddy上Agent Team。

之前我比較苦惱的兩個(gè)點(diǎn)就是Claude太貴，所以我用的是GPT 5.5。但是GPT 5.5很喜歡在生成這個(gè)過程中，把自己的思考過程也塞PPT里，然后就會(huì)變成了一大堆你看著很不順眼的小字。

還有一個(gè)點(diǎn)就是，光用GPT Image2聯(lián)網(wǎng)生成的圖片素材還不是很夠。

有的時(shí)候頁數(shù)長了，我就覺得需要點(diǎn)視頻素材。

這是我用guizang-ppt-skill在Codex（GPT 5.5 High）做出來的PPT。

可以看出來，沒有用GPT Image2重新生成的圖是比例是真的丑，很多時(shí)候只有文字，我們需要更豐富的信息載體。這兩痛點(diǎn)已經(jīng)導(dǎo)致我這份PPT翻工了第四次了，

剛好借這個(gè)機(jī)會(huì)，把我正在打磨的一個(gè)叫做Humanize PPT的Skill做成Agent，

簡單來說，它是一個(gè)內(nèi)容過濾層。

就像大家做前端，做App的時(shí)候，會(huì)想要參考類似于YC總裁 Garry Tan的Office Hour一樣，我在做HTML PPT的時(shí)候，也參考了TED上不同人做PPT的共同特點(diǎn)，總結(jié)出了一個(gè)AST（Audience-State-Transfer｜聽眾狀態(tài)轉(zhuǎn)移）理論。

用人話說，就是說在做 PPT 之前，AI需要自己回答清楚兩個(gè)問題：

這個(gè)PPT的受眾是誰？
在演講過程中，觀眾在看上一頁和下一頁，會(huì)產(chǎn)生什么樣的改變，他們?yōu)槭裁磿?huì)繼續(xù)聽下去。

這就是我之前聽TED演講時(shí)最深的一個(gè)感受，PPT對他們而言，能夠起到在關(guān)鍵節(jié)點(diǎn)展現(xiàn)信息的作用，同時(shí)又不會(huì)太搶戲。

也就是說，這樣做出來的 PPT是適合演講的。

以這里為例，

就是讓聽眾從一個(gè)完全不會(huì)WorKBuddy的人，變成一個(gè)知道怎么用WorKBuddy養(yǎng)龍蝦的人。

Humanize PPT會(huì)根據(jù)用戶狀態(tài)的改變來搭建整體目錄。這樣就不會(huì)出現(xiàn)我們給Agent一大堆參考文件后，它只會(huì)傻傻地按我給的順序來輸出。

相反，Agent需要把所有資料聚合，重新思考整個(gè)過程并進(jìn)行排列，去掉中間無意義的廢話，再把這個(gè)梳理好的大綱交給下游的PPTSkill。

所以我跟常用的2個(gè)HTML PPT Skill（guizang-ppt-skill和frontend-slides）和Remtion，Hhyperframes兩個(gè)視頻制作skill一排即合，做出了一個(gè)Agent團(tuán)隊(duì)。

PS：額外花10s介紹介紹單用這幾個(gè)Skill能做出來的效果

guizang-ppt-skill和frontend-slides

Remtion和有圖片素材下的Hyperframes

跟我在X上看到的那些比較完善，還帶放大縮小和鏡頭移動(dòng)效果的視頻有點(diǎn)出入，

但這確實(shí)是這兩個(gè)Skill在沒有經(jīng)過任何調(diào)優(yōu)，只靠一句話做出來的真實(shí)效果。

它們組合成團(tuán)隊(duì)之后做出來的PPT長這樣，

還帶說明視頻和演講稿，

我要做的就是把網(wǎng)址以及截了個(gè)圖告訴他，我想把這個(gè)網(wǎng)頁里內(nèi)容A到內(nèi)容B中間的東西抽成 PPT，就那么簡單。

以前的做法是單個(gè)Agent放盡可能多的Skill，然后給它寫規(guī)則。

比方說在這里做PPT，我就會(huì)寫，

先用Humanize PPT把現(xiàn)有的材料轉(zhuǎn)成人能看懂的大綱，再用guizang-ppt-skill和frontend-slides做風(fēng)格探索，選到合適的PPT模版，再用Remtion和Hyperframes生成說明視頻才到PPT里，最后上傳成網(wǎng)頁，生成演講稿。

這樣的Workflow有一個(gè)缺點(diǎn)，就是做到40頁左右的時(shí)候上下文限制啥都忘了，

大綱也忘了，風(fēng)格也忘了。

有了騰訊WorkBuddy的Agent專家團(tuán)，我完全可以一個(gè)skill分給一個(gè)Agent。

主Agent就負(fù)責(zé)拆任務(wù)，把任務(wù)分配給對應(yīng)的Skill Agent，其他Agent就同時(shí)開始做自己的部分，不占對方的上下文，也就是說，我們PPT生成有了大綱之后，頁面生成跟說明視頻其實(shí)可以同步做了。

在WorkBuddy上看的話，還可以在左側(cè)看到每個(gè)角色的輸出。如果你發(fā)現(xiàn)有一段不滿意的話，我們還可以進(jìn)行單獨(dú)的調(diào)整。

還能在小程序上直接看進(jìn)度，

當(dāng)然，它現(xiàn)在肯定還不是完美的。

還是會(huì)返工，會(huì)有視頻節(jié)奏的部份需要我來調(diào)，

但這反而是我覺得真實(shí)的地方。

公司里的同事不也這樣。

你不會(huì)因?yàn)橐粋€(gè)設(shè)計(jì)師第一版沒做好，就說設(shè)計(jì)這個(gè)崗位沒價(jià)值了。

你會(huì)給反饋，會(huì)讓他重來一版。

AI團(tuán)隊(duì)也一樣。

這就是我理解的新一代一人公司。

是一個(gè)人開始擁有一套公司級的工作流。

以前你缺設(shè)計(jì)師，缺剪輯師，缺PM。

現(xiàn)在你可以擁有這些崗位的Agent角色。

額度多到用不完的話，

你還可以擁有一個(gè)專門盯著讓每頁P(yáng)PT都有視頻的同事。

這些判斷，過去都被壓在我身上，

我都快成7*24核動(dòng)力驢了，

現(xiàn)在終于可以拆出去一部分了。

如果你對WorkBuddy的新玩法感興趣，

他們現(xiàn)在都有20多個(gè)打包好的團(tuán)隊(duì)了，

今天這一輪跑下來，

我有一個(gè)很強(qiáng)的直覺。

一人公司這概念還會(huì)繼續(xù)火的。

@ 作者 / 卡爾

最后，感謝你看到這里如果喜歡這篇文章，不妨順手給我們點(diǎn)贊｜在看｜轉(zhuǎn)發(fā)｜評論

如果想要第一時(shí)間收到推送，不妨給我個(gè)星標(biāo)

如果你有更有趣的玩法，歡迎在評論區(qū)聊聊

更多的內(nèi)容正在不斷填坑中……

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.