![]()
![]()
近期,讓我最驚訝的AI體驗(yàn),可能就是用Codx做PPT,簡(jiǎn)直是太絲滑了。雖然還是此前被淘汰的模式—Html形式生成。
但生成的效果非常驚艷,而且不可編輯的頑疾也解決了,更重要的是AI 編程越來(lái)越成熟,大家都能隨手生成一份網(wǎng)頁(yè)版的PPT。
為了保證每次生成效果,我們沒(méi)有做成提示詞版本,而是做了一個(gè)叫鯨格PPT的 Skills。主要是考慮國(guó)內(nèi)的很多朋友,用的是沒(méi)有ChatGPT image 2加成的AI助手,通過(guò)復(fù)用Skills也許能保持下產(chǎn)出的平均水準(zhǔn)。
相比很多PPT SKills ,鯨哥做的不是又一個(gè)"AI 幫你填模板"的 PPT 工具,而是一套完整的語(yǔ)義驅(qū)動(dòng)靜態(tài)演示系統(tǒng)。你給它任何原始素材,它先理解內(nèi)容結(jié)構(gòu),再?zèng)Q定怎么呈現(xiàn)。
語(yǔ)義理解級(jí)PPT SKills: 八套主題皮膚,從蘋(píng)果玻璃擬態(tài)到賽博霓虹,從北歐手繪到溫暖紙感講義風(fēng)。同一份內(nèi)容可以自由切換皮膚,結(jié)構(gòu)和主題完全解耦。
![]()
但這只是表面。先講述這套Skills 的架構(gòu)和原理,也許你能更懂它的優(yōu)勢(shì)。
起因:現(xiàn) AI PPT 方案都難受
這兩年 AI 做 PPT 的工具井噴,從 Gamma 到各種國(guó)產(chǎn)方案,看起來(lái)百花齊放。但你真正用過(guò)之后會(huì)發(fā)現(xiàn)一個(gè)共同的問(wèn)題——它們本質(zhì)上都是"模板填充機(jī)"。
流程永遠(yuǎn)是:選個(gè)模板 → AI 幫你生成文案 → 塞進(jìn)預(yù)設(shè)的布局里。看起來(lái)很智能,實(shí)際上你對(duì)最終呈現(xiàn)幾乎沒(méi)有控制力。想調(diào)個(gè)動(dòng)效?不行。想換個(gè)敘事節(jié)奏?不行。想讓封面標(biāo)題用 120px 的中文大字壓住全屏?對(duì)不起,模板沒(méi)這個(gè)位置。
![]()
案例1:史詩(shī)大片感PPT
更要命的是審美問(wèn)題。大部分 AI PPT 工具的審美停留在"商務(wù)藍(lán)+漸變色+圓角卡片"的水平,做出來(lái)的東西放到 2024 年的發(fā)布會(huì)上,會(huì)顯得像 2018 年的產(chǎn)品。你去看蘋(píng)果的 Keynote、看錘子的發(fā)布會(huì)、看任何一個(gè)真正讓人記住的演示——好的 PPT 從來(lái)不是"信息的容器",而是"表達(dá)的節(jié)奏"。
所以我想要的是:AI 理解我的內(nèi)容語(yǔ)義,然后用設(shè)計(jì)系統(tǒng)級(jí)別的審美去呈現(xiàn)它。不是填模板,是真正的"理解→設(shè)計(jì)→渲染"。為什么選 HTML 而不是 .pptx
這是一個(gè)我想了很久的判斷:在 AI 時(shí)代,PPT 的未來(lái)載體是 HTML,不是 .pptx。
原因很直接。.pptx 是一個(gè)封閉格式,你能做的事情被 PowerPoint 的能力邊界死死框住。而 HTML 是 Web Native 的——CSS 動(dòng)畫(huà)、Canvas 粒子、WebGL 3D、視頻嵌入、手勢(shì)交互、響應(yīng)式布局……所有現(xiàn)代 Web 能做的事情,HTML PPT 全都能做。
![]()
案例2:賽博朋克版
更關(guān)鍵的是,HTML 對(duì) AI 極其友好。大模型天然擅長(zhǎng)生成結(jié)構(gòu)化的 HTML/CSS/JS,但讓它去操作 .pptx 的 XML 命名空間?那是折磨。選 HTML 意味著 AI Agent 可以直接、精確地控制每一個(gè)像素。
鯨格做的新奇的事
回到我的 Skill 本身。和市面上所有"HTML PPT 模板庫(kù)"最大的區(qū)別在于,鯨格PPT 多了一層語(yǔ)義中間表示。
傳統(tǒng)方案的流程是:選主題 → 選模板 → 填文案。Agent 直接寫(xiě) HTML。
鯨格PPT的流程是:原始材料 → content-ir.json → 選模板 → 渲染 HTML Deck。
![]()
這個(gè) content-ir(內(nèi)容中間表示)是整個(gè)系統(tǒng)的靈魂。Agent 不直接碰 HTML,而是先把你的內(nèi)容理解成一份結(jié)構(gòu)化數(shù)據(jù)——這頁(yè)的角色是什么(封面?論點(diǎn)?數(shù)據(jù)?轉(zhuǎn)場(chǎng)?),受眾是誰(shuí),場(chǎng)景是什么,每頁(yè)的可見(jiàn)內(nèi)容和講稿分別是什么。
這意味著什么?意味著同一份內(nèi)容可以復(fù)用到完全不同的出口。HTML 是演示 runtime,PDF 是交付 artifact,PNG/SVG 是傳播素材,content-ir 是統(tǒng)一源頭。你做一次內(nèi)容梳理,可以同時(shí)產(chǎn)出演示文稿、講義文檔、社交媒體圖文卡片。這不是做 PPT,這是在做內(nèi)容資產(chǎn)管理。
模板不是"文件放一堆 HTML"
很多開(kāi)源的 HTML PPT 方案,說(shuō)白了就是一個(gè) GitHub 倉(cāng)庫(kù)里放了幾十個(gè) .html 文件,你自己挑一個(gè)改。這不叫系統(tǒng),這叫素材堆。
鯨格PPT 用的是 catalog + schema 驅(qū)動(dòng)的組件注冊(cè)機(jī)制。每個(gè)模板、每個(gè)布局、每個(gè)動(dòng)效都有元數(shù)據(jù)描述——它適合什么場(chǎng)景、需要什么字段、支不支持移動(dòng)端、能不能導(dǎo)出 PDF、要不要 Canvas。Agent 按語(yǔ)義匹配選擇組件,不是按文件名猜。
具體來(lái)說(shuō),系統(tǒng)分了四層職責(zé): 1)full-decks 解決主線敘事結(jié)構(gòu), 2)single-page-layouts 解決長(zhǎng)尾頁(yè)面的靈活補(bǔ)充, 3)animations 解決表達(dá)節(jié)奏, 4)runtime 解決生命周期管理。 每一層各司其職,可以自由組合。動(dòng)效不是裝飾,是敘事節(jié)奏
大部分 PPT 工具對(duì)動(dòng)效的理解還停留在"進(jìn)場(chǎng)飛一下、退場(chǎng)淡一下"的水平。但真正好的演示,動(dòng)效是信息出現(xiàn)的節(jié)奏控制器。
鯨格PPT 把動(dòng)效抽象成了生命周期組件。翻到當(dāng)前頁(yè)才啟動(dòng),翻走就停止。Canvas 粒子效果必須有 start() 和 stop()。這不是 reveal.js 的 slidechanged 事件那么簡(jiǎn)單——它是一套獨(dú)立的動(dòng)效運(yùn)行時(shí),未來(lái)即使完全脫離 reveal.js 也能獨(dú)立工作。
![]()
案例3:蘋(píng)果玻璃態(tài)
而且整套系統(tǒng)不綁定 reveal.js。reveal.js 只是兼容對(duì)象,不是唯一底座。deck-core、slide-lifecycle、canvas-fx-runtime、presenter、gesture、exporter——這些模塊組成了一個(gè)中立的 runtime adapter 架構(gòu)。
審美這件事,寫(xiě)進(jìn)規(guī)則里
我見(jiàn)過(guò)太多技術(shù)很強(qiáng)但審美拉垮的工具了。所以 Sense Deck 有明確的視覺(jué)和內(nèi)容審美原則,直接寫(xiě)進(jìn)了 Skill 的規(guī)則文件里。
Apple Bento:高層級(jí)信息用大卡片承載,留白即信息。
Neumorphic Glass:擬態(tài)玻璃界面,光影層次感拉滿。
Semantic PPT:標(biāo)題必須寫(xiě)結(jié)論而不是寫(xiě)主題詞,內(nèi)容按語(yǔ)義結(jié)構(gòu)重組而不是按原文順序堆砌。中文表達(dá)要口語(yǔ)、現(xiàn)代、直接,絕不能是那種"念稿式"的堆字。
![]()
案例4:疊紙風(fēng)格
這些不是建議,是硬規(guī)則。Agent 生成內(nèi)容的時(shí)候必須遵守。
來(lái)看效果:可編輯大片 PPT
說(shuō)再多不如直接看東西。下面這張是我用 鯨格PPT 生成的"昭君出塞"主題演示:
巨大的中文主標(biāo)題直接壓住畫(huà)面,邊塞、長(zhǎng)路、風(fēng)與孤影退為第二視覺(jué)。是不是不像 PPT,更像電影海報(bào)級(jí)別的視覺(jué)沖擊。而且它支持手勢(shì)翻頁(yè)——右下角那個(gè) MediaPipe 手勢(shì)識(shí)別不是擺設(shè),真的可以用手在攝像頭前揮一下翻頁(yè)。演講的時(shí)候不用碰電腦,這個(gè)體驗(yàn)?zāi)阍囘^(guò)就回不去了。
注意看它的交互系統(tǒng):Space 切換、S 開(kāi)啟演講模式、E 開(kāi)啟編輯模式、G 開(kāi)啟手勢(shì)。對(duì),所有生成的 PPT 默認(rèn)都是可編輯的。文字可以直接點(diǎn)著改,布局可以微調(diào),編輯結(jié)果存 localStorage,還能導(dǎo)出 JSON。
不是一次性的生成物,更像活的文檔。
超多語(yǔ)義化組件
大家用過(guò)任何 AI PPT 工具就知道,它們特別愛(ài)塞圓環(huán)圖、柱狀圖、流程箭頭。不管你的內(nèi)容是什么,反正先來(lái)個(gè)圖表顯得"專業(yè)"。
鯨格PPT 的做法是先識(shí)別內(nèi)容語(yǔ)義,再?zèng)Q定組件形態(tài)。講防護(hù)和合規(guī)?用盾牌、鎖、放大鏡。講 AI Agent 和自動(dòng)化?用玻璃機(jī)器人、小助手方塊。講飛輪和迭代?用晶體環(huán)、軌道、流光帶。講增長(zhǎng)和發(fā)布?用霓虹流帶、動(dòng)勢(shì)組件。
![]()
案例5:數(shù)據(jù)報(bào)告
這里我對(duì)Skills做了針對(duì)不同環(huán)境的設(shè)定,在 Codex 里,能用 AI 生圖就直接生成 PNG/WebP 組件再摳圖放進(jìn) assets,只有不支持多模態(tài)的時(shí)候才降級(jí)用 CSS/SVG/Canvas 畫(huà)近似效果。每個(gè)視覺(jué)元素都是為當(dāng)前內(nèi)容定制的,不是從素材庫(kù)里隨便拽一個(gè)。
一句話總結(jié)定位
市面上的 HTML PPT 方案是"模板素材庫(kù)"。Sense Deck 是語(yǔ)義驅(qū)動(dòng)的靜態(tài)演示系統(tǒng)——先把內(nèi)容變成結(jié)構(gòu)化 IR,再用 deck、layout、theme、animation 和 runtime 組裝成可演示、可導(dǎo)出、可編輯、可擴(kuò)展的 HTML PPT。
![]()
案例6:北歐手繪風(fēng)
它不是讓 AI 幫你"做 PPT",而是讓 AI 幫你把一份內(nèi)容變成多形態(tài)的表達(dá)資產(chǎn)。
誰(shuí)適合用這個(gè)
如果你是那種"打開(kāi) PowerPoint 就頭疼,但對(duì)最終呈現(xiàn)效果又有很高要求"的人,這個(gè) Skill 會(huì)適合你。你只需要給AI安裝上這個(gè)Skills,告訴它一句話主題,直接就給你思考什么風(fēng)格、什么deck適合,緊接著寫(xiě)大綱內(nèi)容、結(jié)構(gòu)梳理、視覺(jué)設(shè)計(jì)、動(dòng)效編排、交互實(shí)現(xiàn)——全部由系統(tǒng)完成。
出來(lái)的不是一個(gè)死的 .pptx 文件,而是一個(gè)活的 HTML 應(yīng)用。可以本地打開(kāi),可以部署到任何靜態(tài)服務(wù)器,可以嵌入網(wǎng)頁(yè),可以手勢(shì)控制,可以實(shí)時(shí)編輯。
這才是 2026 年該有的演示工具的樣子。
進(jìn)群體驗(yàn)PPT Skills:
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.