![]()
![]()
近期,讓我最驚訝的AI體驗,可能就是用Codx做PPT,簡直是太絲滑了。雖然還是此前被淘汰的模式—Html形式生成。
但生成的效果非常驚艷,而且不可編輯的頑疾也解決了,更重要的是AI 編程越來越成熟,大家都能隨手生成一份網頁版的PPT。
為了保證每次生成效果,我們沒有做成提示詞版本,而是做了一個叫鯨格PPT的 Skills。主要是考慮國內的很多朋友,用的是沒有ChatGPT image 2加成的AI助手,通過復用Skills也許能保持下產出的平均水準。
相比很多PPT SKills ,鯨哥做的不是又一個"AI 幫你填模板"的 PPT 工具,而是一套完整的語義驅動靜態(tài)演示系統(tǒng)。你給它任何原始素材,它先理解內容結構,再決定怎么呈現。
語義理解級PPT SKills: 八套主題皮膚,從蘋果玻璃擬態(tài)到賽博霓虹,從北歐手繪到溫暖紙感講義風。同一份內容可以自由切換皮膚,結構和主題完全解耦。
![]()
但這只是表面。先講述這套Skills 的架構和原理,也許你能更懂它的優(yōu)勢。
起因:現 AI PPT 方案都難受
這兩年 AI 做 PPT 的工具井噴,從 Gamma 到各種國產方案,看起來百花齊放。但你真正用過之后會發(fā)現一個共同的問題——它們本質上都是"模板填充機"。
流程永遠是:選個模板 → AI 幫你生成文案 → 塞進預設的布局里。看起來很智能,實際上你對最終呈現幾乎沒有控制力。想調個動效?不行。想換個敘事節(jié)奏?不行。想讓封面標題用 120px 的中文大字壓住全屏?對不起,模板沒這個位置。
![]()
案例1:史詩大片感PPT
更要命的是審美問題。大部分 AI PPT 工具的審美停留在"商務藍+漸變色+圓角卡片"的水平,做出來的東西放到 2024 年的發(fā)布會上,會顯得像 2018 年的產品。你去看蘋果的 Keynote、看錘子的發(fā)布會、看任何一個真正讓人記住的演示——好的 PPT 從來不是"信息的容器",而是"表達的節(jié)奏"。
所以我想要的是:AI 理解我的內容語義,然后用設計系統(tǒng)級別的審美去呈現它。不是填模板,是真正的"理解→設計→渲染"。為什么選 HTML 而不是 .pptx
這是一個我想了很久的判斷:在 AI 時代,PPT 的未來載體是 HTML,不是 .pptx。
原因很直接。.pptx 是一個封閉格式,你能做的事情被 PowerPoint 的能力邊界死死框住。而 HTML 是 Web Native 的——CSS 動畫、Canvas 粒子、WebGL 3D、視頻嵌入、手勢交互、響應式布局……所有現代 Web 能做的事情,HTML PPT 全都能做。
![]()
案例2:賽博朋克版
更關鍵的是,HTML 對 AI 極其友好。大模型天然擅長生成結構化的 HTML/CSS/JS,但讓它去操作 .pptx 的 XML 命名空間?那是折磨。選 HTML 意味著 AI Agent 可以直接、精確地控制每一個像素。
鯨格做的新奇的事
回到我的 Skill 本身。和市面上所有"HTML PPT 模板庫"最大的區(qū)別在于,鯨格PPT 多了一層語義中間表示。
傳統(tǒng)方案的流程是:選主題 → 選模板 → 填文案。Agent 直接寫 HTML。
鯨格PPT的流程是:原始材料 → content-ir.json → 選模板 → 渲染 HTML Deck。
![]()
這個 content-ir(內容中間表示)是整個系統(tǒng)的靈魂。Agent 不直接碰 HTML,而是先把你的內容理解成一份結構化數據——這頁的角色是什么(封面?論點?數據?轉場?),受眾是誰,場景是什么,每頁的可見內容和講稿分別是什么。
這意味著什么?意味著同一份內容可以復用到完全不同的出口。HTML 是演示 runtime,PDF 是交付 artifact,PNG/SVG 是傳播素材,content-ir 是統(tǒng)一源頭。你做一次內容梳理,可以同時產出演示文稿、講義文檔、社交媒體圖文卡片。這不是做 PPT,這是在做內容資產管理。
模板不是"文件放一堆 HTML"
很多開源的 HTML PPT 方案,說白了就是一個 GitHub 倉庫里放了幾十個 .html 文件,你自己挑一個改。這不叫系統(tǒng),這叫素材堆。
鯨格PPT 用的是 catalog + schema 驅動的組件注冊機制。每個模板、每個布局、每個動效都有元數據描述——它適合什么場景、需要什么字段、支不支持移動端、能不能導出 PDF、要不要 Canvas。Agent 按語義匹配選擇組件,不是按文件名猜。
具體來說,系統(tǒng)分了四層職責: 1)full-decks 解決主線敘事結構, 2)single-page-layouts 解決長尾頁面的靈活補充, 3)animations 解決表達節(jié)奏, 4)runtime 解決生命周期管理。 每一層各司其職,可以自由組合。動效不是裝飾,是敘事節(jié)奏
大部分 PPT 工具對動效的理解還停留在"進場飛一下、退場淡一下"的水平。但真正好的演示,動效是信息出現的節(jié)奏控制器。
鯨格PPT 把動效抽象成了生命周期組件。翻到當前頁才啟動,翻走就停止。Canvas 粒子效果必須有 start() 和 stop()。這不是 reveal.js 的 slidechanged 事件那么簡單——它是一套獨立的動效運行時,未來即使完全脫離 reveal.js 也能獨立工作。
![]()
案例3:蘋果玻璃態(tài)
而且整套系統(tǒng)不綁定 reveal.js。reveal.js 只是兼容對象,不是唯一底座。deck-core、slide-lifecycle、canvas-fx-runtime、presenter、gesture、exporter——這些模塊組成了一個中立的 runtime adapter 架構。
審美這件事,寫進規(guī)則里
我見過太多技術很強但審美拉垮的工具了。所以 Sense Deck 有明確的視覺和內容審美原則,直接寫進了 Skill 的規(guī)則文件里。
Apple Bento:高層級信息用大卡片承載,留白即信息。
Neumorphic Glass:擬態(tài)玻璃界面,光影層次感拉滿。
Semantic PPT:標題必須寫結論而不是寫主題詞,內容按語義結構重組而不是按原文順序堆砌。中文表達要口語、現代、直接,絕不能是那種"念稿式"的堆字。
![]()
案例4:疊紙風格
這些不是建議,是硬規(guī)則。Agent 生成內容的時候必須遵守。
來看效果:可編輯大片 PPT
說再多不如直接看東西。下面這張是我用 鯨格PPT 生成的"昭君出塞"主題演示:
巨大的中文主標題直接壓住畫面,邊塞、長路、風與孤影退為第二視覺。是不是不像 PPT,更像電影海報級別的視覺沖擊。而且它支持手勢翻頁——右下角那個 MediaPipe 手勢識別不是擺設,真的可以用手在攝像頭前揮一下翻頁。演講的時候不用碰電腦,這個體驗你試過就回不去了。
注意看它的交互系統(tǒng):Space 切換、S 開啟演講模式、E 開啟編輯模式、G 開啟手勢。對,所有生成的 PPT 默認都是可編輯的。文字可以直接點著改,布局可以微調,編輯結果存 localStorage,還能導出 JSON。
不是一次性的生成物,更像活的文檔。
超多語義化組件
大家用過任何 AI PPT 工具就知道,它們特別愛塞圓環(huán)圖、柱狀圖、流程箭頭。不管你的內容是什么,反正先來個圖表顯得"專業(yè)"。
鯨格PPT 的做法是先識別內容語義,再決定組件形態(tài)。講防護和合規(guī)?用盾牌、鎖、放大鏡。講 AI Agent 和自動化?用玻璃機器人、小助手方塊。講飛輪和迭代?用晶體環(huán)、軌道、流光帶。講增長和發(fā)布?用霓虹流帶、動勢組件。
![]()
案例5:數據報告
這里我對Skills做了針對不同環(huán)境的設定,在 Codex 里,能用 AI 生圖就直接生成 PNG/WebP 組件再摳圖放進 assets,只有不支持多模態(tài)的時候才降級用 CSS/SVG/Canvas 畫近似效果。每個視覺元素都是為當前內容定制的,不是從素材庫里隨便拽一個。
一句話總結定位
市面上的 HTML PPT 方案是"模板素材庫"。Sense Deck 是語義驅動的靜態(tài)演示系統(tǒng)——先把內容變成結構化 IR,再用 deck、layout、theme、animation 和 runtime 組裝成可演示、可導出、可編輯、可擴展的 HTML PPT。
![]()
案例6:北歐手繪風
它不是讓 AI 幫你"做 PPT",而是讓 AI 幫你把一份內容變成多形態(tài)的表達資產。
誰適合用這個
如果你是那種"打開 PowerPoint 就頭疼,但對最終呈現效果又有很高要求"的人,這個 Skill 會適合你。你只需要給AI安裝上這個Skills,告訴它一句話主題,直接就給你思考什么風格、什么deck適合,緊接著寫大綱內容、結構梳理、視覺設計、動效編排、交互實現——全部由系統(tǒng)完成。
出來的不是一個死的 .pptx 文件,而是一個活的 HTML 應用。可以本地打開,可以部署到任何靜態(tài)服務器,可以嵌入網頁,可以手勢控制,可以實時編輯。
這才是 2026 年該有的演示工具的樣子。
進群體驗PPT Skills:
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.