Roto 對自己的定位是「全球首個互動開放世界視頻平臺」。
他們認(rèn)為 AI 時(shí)代應(yīng)該有基于 AI Native 的新形式的高質(zhì)量內(nèi)容,而不是只有那些模仿人類作品的 AI 短視頻。
他們堅(jiān)信未來的內(nèi)容應(yīng)該是與觀眾共同創(chuàng)作的,借助于 AI 驅(qū)動的無限自由敘事,每一次觀看都可以成為一次獨(dú)特的、高沉浸度的體驗(yàn)。
創(chuàng)始人 David Xu 此前曾在 Pinterest、Snap、TikTok 等多家科技獨(dú)角獸企業(yè)負(fù)責(zé)內(nèi)容和 AI 相關(guān)的工作,在決定做 Roto 之前,他們曾設(shè)想過基于無限畫布的視頻生成、類 Sora 形態(tài)的社交視頻產(chǎn)品,但都在產(chǎn)品還沒上線之前,發(fā)現(xiàn)已經(jīng)有大廠發(fā)布了類似產(chǎn)品。
痛定思痛后,他們決定,「要么就做得更大膽,去做那種可能一兩年技術(shù)都不成熟、但你堅(jiān)信的極致創(chuàng)新」。
這才有了現(xiàn)在的 Roto,完全自研的內(nèi)容生產(chǎn)管線、自研的視頻播放平臺,并且即將在品牌商業(yè)廣告上實(shí)現(xiàn)了初步的商業(yè)閉環(huán)。在模型技術(shù)還沒成熟的今天,先去探索下一代內(nèi)容的可能性形式,等到視頻模型的真正 Nano Banano 時(shí)刻來臨,在此之前,一直在場上。
Seedance 2.0 是個很好的信號,2026 年的視頻生成賽道,距離 Roto 想要的模型躍遷時(shí)刻,或許很近了。
以下是 Founder Park 與 Roto 創(chuàng)始人 David 的對話,經(jīng)編輯整理。
產(chǎn)品體驗(yàn):https://rotopus.art/
??關(guān)注 Founder Park,最及時(shí)最干貨的創(chuàng)業(yè)分享
超 19000 人的「AI 產(chǎn)品市集」社群!不錯過每一款有價(jià)值的 AI 應(yīng)用。
邀請從業(yè)者、開發(fā)人員和創(chuàng)業(yè)者,飛書掃碼加群:
進(jìn)群后,你有機(jī)會得到:
最新、最值得關(guān)注的 AI 新品資訊;
不定期贈送熱門新品的邀請碼、會員碼;
最精準(zhǔn)的 AI 產(chǎn)品曝光渠道
01與其進(jìn)入一個很卷的賽道,
不如把夢想做大點(diǎn)
Founder Park:介紹下之前的工作經(jīng)歷?
David:大學(xué)畢業(yè)后我就出國了,大部分時(shí)間在硅谷各個獨(dú)角獸公司之間游走,比如 Pinterest、TikTok、Snapchat。最近幾年我一直深耕 AI 領(lǐng)域,從 TikTok 到 Snapchat,再到回國,始終在做從 0 到 1 的 AI 新產(chǎn)品。從早期生圖還不火的時(shí)候,到后來的多模態(tài)生成,包括視頻、音頻,都參與過相關(guān)項(xiàng)目。
在 Snapchat,我負(fù)責(zé)做了一整套相當(dāng)全面的多模態(tài)生成功能。我們的目標(biāo)是把相機(jī)拍攝器下的所有工具都用 AI 重新做一遍。比如 caption,你貼一張圖,AI 會自動生成注釋;你想配樂,AI 可以根據(jù)調(diào)性自動匹配;甚至所有的橡皮擦、生圖、inpainting,這些都是可以在上面加?xùn)|西、減東西、刪東西等。那段經(jīng)歷讓我把各種模態(tài)的東西都跑了一遍,評測了大量模型效果,這對我現(xiàn)在判斷內(nèi)容質(zhì)量有很大幫助。
2023 年視頻模型開始出現(xiàn),到現(xiàn)在,生圖模型已經(jīng)非常商用化,像 Nano Banana Pro 這種級別基本已經(jīng)很完善,沒有太大增長空間了。現(xiàn)在大家在拼視頻模型,希望它達(dá)到 Nano Banana Pro 那樣的級別。這也是為什么我覺得要開始思考新的內(nèi)容形態(tài),這才是 AI 帶來的機(jī)會。
![]()
David Xu
Founder Park:大概是什么時(shí)候決定出來創(chuàng)業(yè)的?
David:這個想法很早就有了。一個人是否適合創(chuàng)業(yè),自己通常會有感知。如果你在一個大環(huán)境里總覺得有點(diǎn)慢、不夠靈活,或者總是對決策有不同看法,說明你渴望擁有更多的主動權(quán)。當(dāng)你知道方向時(shí),就會想盡快把它實(shí)現(xiàn),這樣的人其實(shí)相對適合創(chuàng)業(yè)。我基本是 2024 年從海外回來后,就一直在研究創(chuàng)業(yè),接觸各種創(chuàng)業(yè)者、投資機(jī)構(gòu)。
2025 年上半年,我正式和我現(xiàn)在的合伙人開啟了現(xiàn)在的事情。
Founder Park:那你們現(xiàn)在的創(chuàng)業(yè)想法,中間變過嗎?
David:變過很多次,這很難不變。我一直堅(jiān)定要做內(nèi)容和創(chuàng)意,之前的工作之余也做很多線下演出型的內(nèi)容創(chuàng)作。但這個領(lǐng)域能做的事情太多了,我們也經(jīng)歷過兩三次方向調(diào)整。
去年年中,好幾次我們想到的一些點(diǎn)子,在做到差不多準(zhǔn)備上線,或者 Demo 出來內(nèi)部測試的時(shí)候,國內(nèi)大廠就已經(jīng)推出了一個很完備的、和我們想法差不多的東西。
比如「無限畫布」,可以在上面刪刪改改,我們上半年想做,后來快手的可靈就上線了,海外的 Flora 很早在做,現(xiàn)在它基本已經(jīng)變成一個標(biāo)配功能了,當(dāng)時(shí)感覺再做意義也不是特別大。還有像 Sora App 社交的形式,我們也做了一個幾乎一模一樣的 Demo,連橫滑豎滑的交互組合都和我們當(dāng)時(shí)的概念視頻完全一致。我們做的時(shí)候它還沒發(fā)布,結(jié)果過了幾個月它就發(fā)了。如果我們堅(jiān)定地做下去,投入幾個月后發(fā)現(xiàn)追不上,再去做推廣可能也追不上,那時(shí)候再撤退,我覺得判斷的時(shí)間點(diǎn)不夠好。你要么就更早做判斷,要么就更長時(shí)間地堅(jiān)持。
后來我的思考就是:要么做非常具體的需求,更 ToB,做出來就知道有人付費(fèi),把它當(dāng)成純工具和服務(wù)的東西;要么就做得更大膽,去做那種可能一兩年技術(shù)都不成熟、但你堅(jiān)信的極致創(chuàng)新。最后我選擇了后者。雖然現(xiàn)在的產(chǎn)品在技術(shù)和內(nèi)容上都不成熟,但是我們能想到的它的未來是無比光明的,愿意陪著技術(shù)和內(nèi)容一起思考,和整個市場一起去努力,去構(gòu)想它未來的樣子。
Founder Park:與其進(jìn)入一個現(xiàn)在看來已經(jīng)很卷的賽道,不如把思路放大一點(diǎn)。那現(xiàn)在回頭看 Sora App,會慶幸沒做嗎?
David:也不是,我還是蠻看好的。雖然它的數(shù)據(jù)上其實(shí)不夠好,留存幾乎接近于零。但我覺得很多概念本身沒問題,只是可能故事講得太快,或者市場的耐心不夠。
比如 2021、2022 年有一陣數(shù)字人和元宇宙很火,大家都覺得是未來,但明顯是概念走得比技術(shù)遠(yuǎn)太多了,技術(shù)追不上,熱度就會降下來。我不是說 Sora App 和它一樣,Sora 2 走的方向是「人人都能創(chuàng)作」。大家都可以快速上手、快速生產(chǎn),這樣帶來的結(jié)果就是內(nèi)容的可看性和可消費(fèi)性相對較低。這也是現(xiàn)在大部分內(nèi)容工具產(chǎn)品的方向:先讓更多人使用。這樣做出來的東西可能消費(fèi)性不高,但用戶多了,商業(yè)化就好做一點(diǎn),訂閱會更好。
但我一直想走另一條路,就是先做出好的東西,讓大家知道 AI 不僅僅是降低門檻、降本增效,它其實(shí)可以做出高品質(zhì)的內(nèi)容,有它自己的特性,在某些方面甚至可以比人做得更有看頭。它不是一個在品質(zhì)線之下純粹降本增效的東西,是可以達(dá)到品質(zhì)線的。
這也是我們現(xiàn)在堅(jiān)持要做高品質(zhì)內(nèi)容的原因,我希望大家對 AI 內(nèi)容的觀念能有轉(zhuǎn)變,不要一提到 AI 內(nèi)容就覺得是那種模板化的東西。如果產(chǎn)品的用戶教育一直是「嘗鮮」,看不到新鮮的好東西,產(chǎn)品很快就會讓用戶產(chǎn)生「創(chuàng)意疲勞」,留存率就會很低。Sora App 當(dāng)時(shí)也是這個方向,內(nèi)容同質(zhì)化且質(zhì)量偏低,大家在平臺上看不到太多新鮮的好東西,留下來的意義就小了很多。
02在技術(shù) Ready 之前,
先探索 AI Native 的內(nèi)容形式
Founder Park:你們當(dāng)時(shí)決定切入這個賽道,是因?yàn)橛X得技術(shù)成熟了,還是想法更明確了?
David:我覺得是想法更明確,技術(shù)還是不夠成熟的。
現(xiàn)在做的東西,我們定義為「AI 開放世界視頻」,比較接近交互視頻,但在樣式上有區(qū)別,開放世界的想象空間非常高。現(xiàn)在只是 MVP 版本,未來能做的太多了。如果我們把它定義為「第十藝術(shù)」,它也值得一個新的名字。所以我們現(xiàn)在叫它「開放世界視頻」,算是借用了「開放世界」這一廣為人知的概念來幫助理解。
做這件事基于我對行業(yè)長期的觀察。AI 作為一個新技術(shù),應(yīng)該可以帶來一種新的內(nèi)容樣式,而不僅是復(fù)刻視頻、圖片、音頻。這些都不能代表 AI 的核心特色。歷史上,每個新技術(shù)的到來都能催生新樣式:照相機(jī)的發(fā)明帶來了攝影; PC 的出現(xiàn)催生了「第九藝術(shù)」游戲。AI 也應(yīng)該如此。
實(shí)時(shí)性意味著觀眾可以快速參與,創(chuàng)作一個作品不再需要花一兩年時(shí)間。個性化意味著觀眾能加入自己的身份、形象、名字,與情節(jié)互動,它會帶來創(chuàng)作者和觀眾邊界的相對融合。我們定義的未來內(nèi)容,創(chuàng)作者可能占 60% 主導(dǎo),設(shè)定一個框架而不再是一個靜態(tài)的作品;觀眾有 30% 交互空間,有很高的自由度去改變劇情;最后 10% 是模型的隨機(jī)性,如果之后模型有更大的進(jìn)步,隨機(jī)性可能會更小。當(dāng)然也有可能我們喜歡這種隨機(jī)性,這些都可以開放討論。
![]()
Founder Park:在 2025 年做這個事情,你們怎么判斷技術(shù)的階段?如果做得太早,可能做了一年技術(shù)都無法解決實(shí)時(shí)性生成的問題,導(dǎo)致前期只是在做技術(shù)積累,這對于創(chuàng)業(yè)公司來說是很難承受的。
David:我希望能達(dá)到趁勢而上的效果,但沒人能真正完美地預(yù)測。比如現(xiàn)在的視頻模型更多在乎效果,實(shí)時(shí)性還不是重點(diǎn)。但我們也看到有些公司在做相對快速的模型,效果更偏向小一點(diǎn)的垂類。我判斷在我們做到 6 個月到 1 年的時(shí)候,這些模型的生成速度應(yīng)該都會開始優(yōu)化,達(dá)到秒級甚至更實(shí)時(shí)。
我們大概有這種判斷,但我沒有自信說一定能判斷得很準(zhǔn)。因?yàn)榧夹g(shù)的發(fā)展其實(shí)是階梯性的,不是線性的。可能突然出現(xiàn)一個新的算法,技術(shù)就上了一個臺階,然后大家再對模型進(jìn)行調(diào)優(yōu),比如參數(shù)變大,進(jìn)入一個相對平緩的增長期,再等待下一個階梯。這個階梯什么時(shí)候來,我無法準(zhǔn)確地判斷。
所以,一方面是我有一個預(yù)判,未來某個時(shí)刻技術(shù)會成熟,我們就可以順勢而為。另一方面,在這條路上,現(xiàn)在也有很多可以做的事情,不是非得等著實(shí)時(shí)模型效果很好了再做。如果等到那個時(shí)候,所有人都可以直接做了。除了技術(shù),其實(shí)還有很多產(chǎn)品和內(nèi)容層面的東西需要打磨。
比如,每個新內(nèi)容樣式出現(xiàn)時(shí),該做什么內(nèi)容?這是一個大家經(jīng)常忽視的視角。短視頻出現(xiàn)時(shí),豎屏 15 秒,你不能再用拍 YouTube 長視頻的思路去拍。豎屏意味著可以拍全身,肢體動作可以更夸張,更有沖擊力。15 秒意味著節(jié)奏要快,要迅速給出興奮點(diǎn)。這就催生了產(chǎn)品上的需求,比如分段拍攝、多樣化的剪輯效果。對于交互視頻也一樣,怎樣的交互是好玩的、有意義的?劇情該怎么走?它相當(dāng)于一種平行世界的敘事,視覺風(fēng)格該如何設(shè)計(jì)?這些都有巨大的探索空間。所以,我們可以從內(nèi)容層面反向思考,給產(chǎn)品提供新功能的建議,與技術(shù)一同進(jìn)步。
Founder Park: 你的意思是,可能今天的 60% 或 70% 的技術(shù),已經(jīng)可以搭建MVP版本來探索新的內(nèi)容形態(tài)了。在這個基礎(chǔ)上,你們需要提前研究它的交互方式、呈現(xiàn)形式等等。因?yàn)槲覀儚膩頉]見過一個純粹自由的實(shí)時(shí)交互視頻內(nèi)容,所以需要一步步去探索。
David:對。包括我們追求高質(zhì)量,就是希望新內(nèi)容樣式出來時(shí),能讓大家看到一個標(biāo)準(zhǔn)線以上的東西,看到它的上限,而不是一上來就覺得「不過如此」。所以我們現(xiàn)在和上海戲劇學(xué)院的導(dǎo)演、編劇合作,一起思考敘事結(jié)構(gòu);也和業(yè)界頭部的 AIGC 創(chuàng)作者合作制作片子。我們希望能在這方面做深入的思考,做出優(yōu)質(zhì)內(nèi)容,讓大家看到它能帶來的價(jià)值。
![]()
Roto 故事庫中的部分短片
03互動劇沒成不是因?yàn)椴缓每矗?/strong>
而是 ROI 不高
Founder Park: 提到可交互視頻,很多人會想到 Netflix 那種可選擇的互動劇。Netflix 最后也算是放棄了這個方向。你覺得它沒成功是什么原因?
David:我只能基于自己的角度分析,我覺得整體是一個 ROI 的問題。網(wǎng)飛拍一個像《黑鏡:潘達(dá)斯奈基》那樣的選擇式互動劇,最后可能有十幾個不同結(jié)局。這意味著他們要用四五倍的體量去拍一個同樣時(shí)長的東西,還要花更長時(shí)間構(gòu)思劇本走向,因?yàn)槌銎焚|(zhì)量要有保障。
內(nèi)部團(tuán)隊(duì)肯定會算這筆賬:它帶來的收益會比拍一部《怪奇物語》的續(xù)集更高嗎?它的成本遠(yuǎn)高于普通劇集,收益卻未必有那么大的增長,可能只是在市場上造成聲量。如果持續(xù)拍這類劇,劇本難寫,制作周期又長,到底值不值?所以對他們來說,試一下就行了。
AI 時(shí)代之所以讓這種形式變得更可行,就是因?yàn)?AI 生成降低了制作成本。你規(guī)劃的部分可能只是一個框架,血肉可以由 AI 去填充,制作成本就不會那么高了。
Founder Park: 所以更多是性價(jià)比問題。用人力去堆砌交互體驗(yàn),最終收益可能還不如用同樣時(shí)間拍三部普通劇帶來的。這兩年也有很多影視公司在做所謂的「互動影游」,它的性質(zhì)和你說的差不多,只是把互動視頻做成了一個所謂的游戲,你怎么看這類產(chǎn)品?
David:那些對我們來說都是啟發(fā)。過去的產(chǎn)品劇情固定,比較像選擇題,開放性相對受限。我們想把「選擇題」變成「填空題」,甚至是「解答題」。你可以通過文字或語音輸入,獲得更大開放程度。而且過去的產(chǎn)品制作門檻很高,無論是做成游戲上架 Steam,還是作為一個劇拍出來。
我們的產(chǎn)品有觀看端和創(chuàng)作端,創(chuàng)作端可以賦能到每一個人,只要你有想法,就可以做這樣的內(nèi)容。它的開放度和能力上限都很高,當(dāng)然,上手需要一定的學(xué)習(xí)時(shí)間,因?yàn)樗且粋€全新的內(nèi)容形態(tài)。我們前期和很多專業(yè)創(chuàng)作者聊的時(shí)候,他們都表示很興奮。現(xiàn)在很多導(dǎo)演或 AIGC 創(chuàng)作者其實(shí)都想做偏游戲性的東西,但沒有開發(fā)能力或團(tuán)隊(duì)。我們相當(dāng)于提供了這個工具,他們就可以做出這樣的片子。
Founder Park: 無論是網(wǎng)飛的互動劇,還是現(xiàn)在的互動游戲,能火的前提是內(nèi)容消費(fèi)體驗(yàn)好,質(zhì)量足夠高。能做出這些內(nèi)容的人是比較高質(zhì)量的創(chuàng)作者。如果把這個能力平臺化,降低了創(chuàng)作者門檻,還能奔著「高質(zhì)量」去嗎?這兩點(diǎn)會不會有沖突?
David:第一,用同樣的 AI 工具,普通用戶和專業(yè)創(chuàng)作者的內(nèi)容品質(zhì)差距非常大。專業(yè)創(chuàng)作者已經(jīng)可以創(chuàng)造出很多能賣給品牌的商用廣告,說明作品質(zhì)量已經(jīng)達(dá)到了很高水準(zhǔn)。在我們社群里,都是國內(nèi)最頭部的創(chuàng)作者,承包了全國 80% 的高質(zhì)量商用 AIGC 內(nèi)容。即便只是靜態(tài)內(nèi)容,用同樣的模型,不同的人做出來差距也很大。
在我們的內(nèi)容形態(tài)里,創(chuàng)作者會設(shè)定一個世界觀、畫風(fēng)、人物,或者很多過渡的橋段,這些就像是建筑的「柱子」,是提前埋好的。可能會有一些部分是用戶交互的時(shí)候填進(jìn)去的,至少可以保證是在框架內(nèi)進(jìn)行的,系統(tǒng)提示詞層面也有之前的專業(yè)創(chuàng)作者提供的世界設(shè)定以及人物設(shè)定,可能也會有一些關(guān)鍵幀,這些的控制會幫助 AI 更融入劇情,能保證內(nèi)容更相關(guān)、質(zhì)量更高,審美更強(qiáng),風(fēng)格也更統(tǒng)一。不可能說在一個輕功的環(huán)境里,非要生成一個在宇宙里打架的科幻故事。
第二,我們現(xiàn)在相對鼓勵 PGC 和 PUGC 來創(chuàng)作,也是希望一開始就有高質(zhì)量內(nèi)容打底。但我們也不會讓普通用戶無從下手。未來我們可能會做分區(qū),「內(nèi)容會有「品質(zhì)劇集」可以去看,也會有類似游樂場的分區(qū),大家可以簡單創(chuàng)作,隨意發(fā)布作品。
Founder Park:如果用戶提了一個特別「飛」的需求,比如本來是一個古代背景,他突然說「這時(shí)候來了一艘宇宙飛船」。你們現(xiàn)在是會拒絕生成,還是怎么處理?
David:我們現(xiàn)在的做法是把這個控制權(quán)交給創(chuàng)作者。創(chuàng)作者在構(gòu)建故事時(shí),可以自己決定這個故事的開放性有多大。比如,你的設(shè)定可以是「觀眾輸入什么都行,要宇宙飛船也給他」,而我的設(shè)定可能是「不行,我還是希望他在我的框架里玩」。這體現(xiàn)了不同創(chuàng)作者的審美和他希望觀眾體驗(yàn)的傾向。所以,這個自主權(quán)我們交給了創(chuàng)作者,讓他自己去決定,自己的作品,他的觀眾跟他共創(chuàng)的時(shí)候會玩得有多飛。
Founder Park:現(xiàn)在有語音和文字輸入,為什么考慮加入語音?感覺這會讓輸入信息的收集變得更復(fù)雜。
David:語音的溝通效率很高。用戶可以在更短時(shí)間內(nèi)反應(yīng),而且它的想象空間很大。比如我們可以做一些女性向的內(nèi)容,你可以和里面的男主角進(jìn)行語音對話、聊天。
04核心是用 AI 幫助用戶搭建更自由的故事樹
Founder Park:你們現(xiàn)在的能生產(chǎn)多長的視頻?允許用戶交互多少次?
David:目前沒有限制。只要創(chuàng)作者能一直做下去,工程就可以做得非常長,主要看精力和想法。理想上也是,要給市場和創(chuàng)作者自由度,有人想做 10 分鐘,有人想做半小時(shí),有人想做 3 分鐘,都得讓他們做,市場會告訴我們說哪種時(shí)長、哪種內(nèi)容是觀眾喜愛的。
Founder Park:現(xiàn)階段的產(chǎn)品交互和功能設(shè)計(jì)上,是怎么考慮的?
David:這個創(chuàng)作工具是全球首發(fā)的,之前沒有任何競品做過這種東西,包括我們的觀看端,這種 AI 交互式播放器同樣是全球首發(fā),目前也沒有人在做。
![]()
用戶可以通過輸入文字指令,改寫故事情節(jié)
因此,這個創(chuàng)作工具的很多部分,其實(shí)是在定義一種新的交互方式,它的模塊和傳統(tǒng)靜態(tài)作品或藝術(shù)內(nèi)容的模塊是不一樣的。說實(shí)話,整體還是有挺高的學(xué)習(xí)門檻。
所以我們的做法是定義了幾種不同的模塊。
一種是交互模塊,在這會引導(dǎo)用戶輸入,比如在某個節(jié)點(diǎn)向用戶提問,用戶的輸入會被保存下來,之后可以繼續(xù)用。
另一種是生成模塊,把之前從用戶那里收集到的各種輸入,用來生成新的內(nèi)容。
還有一種是情節(jié)梳理模塊,也就是把用戶的輸入交給語言模型去判斷,決定情節(jié)的走向。比如在我預(yù)設(shè)的框架里,它會智能地判斷走哪條支線更符合,并生成觀眾需要的內(nèi)容。所以,現(xiàn)在我們主要是在定義這些新的模塊,無論是交互、生成,還是情節(jié)樹的搭建。當(dāng)然,這只是 MVP 版本,我們還有很多更大膽的想法正在嘗試。對于新的內(nèi)容形態(tài),我認(rèn)為還是要先拿出一個版本讓大家看,然后再根據(jù)反饋修改,在不斷的交互中向前推進(jìn)。
Founder Park:如果我現(xiàn)在想復(fù)刻《黑鏡:潘達(dá)斯奈基》。原片可能有固定的三條故事線,但在你們的平臺上,創(chuàng)作者需要為用戶的各種輸入提供可能性。這是否意味著,創(chuàng)作者需要定義好允許什么樣的提示詞或想象空間,后續(xù)的視頻生成是前端即時(shí)的嗎?
David:是的,這也是由創(chuàng)作者自己決定的:哪部分是由我預(yù)設(shè)的「血肉」,哪部分是由觀眾輸入的「血肉」來填充。觀眾的每一次輸入,都可以通過語言模型進(jìn)行判斷,你可以選擇讓它在既定分支上做選擇,也可以讓它完成多模態(tài)的生成,無論是視頻、音頻、文字還是圖片。它不一定只是生成一段視頻。比如,你也可以把劇情設(shè)計(jì)成與角色對話,我輸入的語言通過模型處理后,生成角色的回應(yīng)。你也可以讓我輸入的內(nèi)容在后續(xù)劇情里變成一條飄過的彈幕。這都取決于創(chuàng)作者的意圖,你的想法有多豐富,完成度就有多高。
Founder Park:這會不會進(jìn)一步縮小你們目標(biāo)創(chuàng)作者的群體范圍?
David:早期,群體范圍一定會相對較小,但之后我們一定會降低創(chuàng)作門檻。比如我們正在做的智能體輔助創(chuàng)作,至少能讓 AI 更多地參與框架搭建,這個功能近期就會上線。此外,我們也會做一些模板性的東西,類似一個「游樂場」,讓 C 端用戶可以玩起來。讓他們知道自己可以簡單地做出作品,可能做完第一個作品后,就有更強(qiáng)的動力去做更復(fù)雜的。用戶的培養(yǎng)和成長體系,我認(rèn)為之后是會補(bǔ)的。所以,現(xiàn)在只是一個 MVP,但它的發(fā)展空間非常大。
Founder Park:相比單純用基礎(chǔ)模型生成視頻的公司,你們的核心更像是在解決:如何幫創(chuàng)作者把各種素材搭建成一個更豐富的故事樹?
David:是的,可以這么理解,這也是一個差異化的點(diǎn)。我和很多視頻基礎(chǔ)模型的公司交流過,他們的視角更偏向于在技術(shù)上解決「生成」這個難題,但對于應(yīng)用場景還沒有很聚焦和垂直。而我們的方向是在一個很垂直的應(yīng)用場景里,已經(jīng)想得比較清楚了。說實(shí)話,我們這種場景非常適合做自研,因?yàn)槲液芮宄匝惺裁礃拥哪P湍芨玫貪M足我的需求。我也在和一些模型廠商聊自研合作。我們對產(chǎn)品和內(nèi)容的判斷,也可以幫到那些有自研方向但不知道該聚焦何處的廠商落地。
05AI 短劇、AI 漫劇同樣可以產(chǎn)出高質(zhì)量內(nèi)容
Founder Park:內(nèi)容側(cè)來看,消費(fèi)高質(zhì)量、實(shí)時(shí)性互動內(nèi)容的需求,會不會是一個偽命題?
David:其實(shí)很多人是這么認(rèn)為的。之所以覺得它是偽命題,是因?yàn)榇蠹一诂F(xiàn)有的習(xí)慣去思考。比如觀眾交互意愿是低的,你突然讓人停下來輸入,他可能腦子一片空白。
Founder Park:大家越來越懶了。
David:現(xiàn)在的視頻越看越短,大家可能手都不想動,你還讓大家輸入。但這是因?yàn)楝F(xiàn)在的內(nèi)容就不是為交互設(shè)計(jì)的。這里我們的內(nèi)容思考空間很大,怎么讓用戶愿意交互?比如讓劇情人物在特定情境下主動引導(dǎo)你。比如《復(fù)仇者聯(lián)盟》最后,鋼鐵俠大戰(zhàn)滅霸,馬上就要犧牲了,這時(shí)候如果問你「想不想要另外一個結(jié)局,讓鋼鐵俠復(fù)活?」,你可能就會想「好,我想看看會發(fā)生什么」,你可能順理成章就交互了。比如,畫面上面如果有一些視覺的興趣點(diǎn),比你走著走著那邊有一個長得跟環(huán)境格格不入的大蘑菇,你有可能就停在那了,你就會說,去那看看到底是什么東西。
![]()
在關(guān)鍵情節(jié),會彈出提示主動引導(dǎo)用戶
其次,用戶的想象力有限,但是「用戶們」的想象力是豐富的。我們可以提供輸入提示,或者讓他看別人怎么玩的,激發(fā)創(chuàng)作動力。作為個體,我可能沒有輸入的傾向,但是我去看別人玩過的東西,或者通過別人的輸入去加入我的想法、再二創(chuàng),可能就會有更多動力。
Founder Park: 也就是說,你對人類消費(fèi)高質(zhì)量內(nèi)容的需求是有信心的。
David:我有信心。
Founder Park:這一點(diǎn)我有點(diǎn)矛盾。經(jīng)歷了精品大片內(nèi)容的時(shí)代,再看到現(xiàn)在很多消費(fèi) 1 分鐘的短劇,會覺得有點(diǎn)絕望。
David:我也和很多做短劇的朋友,包括上戲的導(dǎo)演、編劇朋友聊過同樣的問題。他們說,長內(nèi)容會回來的。
在我看來,人類感興趣的東西其實(shí)一直沒怎么變,從古希臘文學(xué)里的那些情節(jié),到現(xiàn)在的霸道總裁,本質(zhì)的吸引點(diǎn)是一樣的。內(nèi)容的長短會有輪回和波動。而且,現(xiàn)在大家覺得視頻越拍越短、越拍越碎,短劇這么火,不代表長劇就不會回歸。審美和時(shí)尚是有輪回的。況且,短不代表不能交互,短劇也可以做交互,長劇也可以,它們各有各的價(jià)值。
Founder Park:所以你認(rèn)同 AI 短劇、AI 漫劇同樣可以產(chǎn)出高質(zhì)量內(nèi)容。
David:我認(rèn)同。長劇只是把那些吸引人的點(diǎn)做了更豐富的鋪陳,讓情感更充沛。短劇只是把節(jié)奏壓縮得更短。我有看長劇的需求,也有看短劇的需求,我相信長劇還是會回來的。只要我們抓住那些本質(zhì)的點(diǎn),就是 OK 的。
我覺得這其實(shí)也跟制作市場的 ROI 相關(guān)。一部電影長片的制作周期可能是兩三年,你很難準(zhǔn)確把握市場,不確定投入之后的回報(bào)率。以前的長電視劇也一樣。但現(xiàn)在短劇的制作成本和周期都極短,可能在橫店 10 天就拍出來了,能獲得非常快速的市場反饋。在商業(yè)市場上,這筆賬很好算,也很容易掙錢。所以大家就不斷復(fù)制成功的橋段和品類,起碼能活很久。這本質(zhì)上還是一個生意和 ROI 的問題。
Founder Park:所以,AI 在某種意義上,會降低我們過往制作高質(zhì)量內(nèi)容,比如商業(yè)大片的風(fēng)險(xiǎn)。
David:我覺得會。因?yàn)?AI 本身就有降本增效的屬性,制作周期和成本都可以壓縮一個數(shù)量級。另外,AI 內(nèi)容可以有自己的調(diào)性。現(xiàn)在 AI 還在走模仿傳統(tǒng)內(nèi)容的路,但它其實(shí)可以走一條自己的路,這也是為什么需要新的內(nèi)容樣式。它的特征就是,一方面可以做很個人化的東西,我們每個人都可以把自己的故事加進(jìn)去;另一方面可以做很多超現(xiàn)實(shí)、風(fēng)格融合的東西。它完全可以去突破一些新的風(fēng)格,再次去激活市場。
06「一家基于 AI 技術(shù),去探索下一代內(nèi)容樣式的公司」
Founder Park:你希望行業(yè)或者外界怎么定義你們?一個做廣告的公司,還是一個做內(nèi)容生產(chǎn)平臺的公司?
David:我覺得還是內(nèi)容公司。我們不是賣廣告,我們是賣新的內(nèi)容樣式。我們希望把這種內(nèi)容樣式推廣到讓每個人都知道,廣告是其中一個重要的途徑和商業(yè)化的橋梁。所以我們對內(nèi)對外的定位都是「AI 內(nèi)容公司」。
Founder Park:如果用一句話來定義公司呢?
David:基于 AI 技術(shù)去探索下一代內(nèi)容樣式的公司。
Founder Park:對于你們平臺來說,我理解目前的核心用戶是創(chuàng)作者。那么產(chǎn)品設(shè)計(jì)和商業(yè)模式都會圍繞他們服務(wù)。創(chuàng)作者為平臺供給內(nèi)容,他們就是商業(yè)模式的核心。
David:它有一個順序,像一個飛輪。現(xiàn)階段需要先有好的內(nèi)容,那就需要先有創(chuàng)作者。有了好的內(nèi)容,我們再去做推廣和增長,就能吸引來用戶。這個平臺未來的主流用戶一定是觀眾。所以后期要不斷完善的是觀看端的體驗(yàn)。有了好內(nèi)容,吸引來更多觀眾,他們接受了這種新樣式,就會有更多人關(guān)注。這不僅能激勵已有的創(chuàng)作者,也能讓現(xiàn)有觀眾轉(zhuǎn)化成創(chuàng)作者。同時(shí),有觀眾就有商業(yè)價(jià)值,也能吸引品牌客戶來做新的廣告。
這一切都源于內(nèi)容,內(nèi)容帶來觀眾,觀眾帶來更多的創(chuàng)作者和商業(yè)機(jī)會,他們再進(jìn)入創(chuàng)作鏈條,帶來更多內(nèi)容,這樣飛輪就跑起來了。
Founder Park:核心創(chuàng)作者是所有平臺爭搶的對象,你們靠什么來留住他們?
David:大家都要對創(chuàng)作者好一些,要么讓他成名,要么讓他掙錢。所以要給他們明確的收益方向。早期平臺可能沒有直接的收益分成,但一些激勵計(jì)劃、補(bǔ)貼是不可避免的,所有大平臺早期都是這么做的。我朋友圈里的那些超級創(chuàng)作者,都和大平臺有商業(yè)合作。雖然我們是小公司,但在內(nèi)容上付費(fèi)一直都是值得的。
只要能做出好的內(nèi)容,拿內(nèi)容去做宣發(fā),就一定可以吸引來觀眾和商業(yè)伙伴。到時(shí)候,我們就可以把這種形式做成一種新的廣告樣式,比如開放世界的互動廣告,你可以在里面改變代言人的樣子,或者改變產(chǎn)品。像這類商單,我們現(xiàn)在已經(jīng)有很多很有意向的品牌客戶在對接,我們也會把這些商單都推薦給我們的創(chuàng)作者,讓他們有實(shí)際的收益。
Founder Park:這個算現(xiàn)階段已經(jīng)跑通的商業(yè)場景嗎?
David:正在跑通的過程中,現(xiàn)在基本算是 halfway。有很多積極的合作意向,也正在做一些用于 pitch 的 Demo。我們對這個方向的商業(yè)化很有信心,作為一種廣告樣式是可以跑起來的。AIGC 創(chuàng)作者的商單是很大的收入來源,只要品牌愿意為新形式付費(fèi),這就是個正向循環(huán)。
Founder Park:這會不會帶偏平臺的調(diào)性?
David:這是分開的。這些廣告不會放在我們平臺上,可以作為一種服務(wù),以 H5 的形式出現(xiàn)在品牌自己的商業(yè)鏈條里,比如他們的社交媒體或官網(wǎng)里。
Founder Park:你覺得產(chǎn)品到哪個階段才算找到了大家認(rèn)可的 PMF?
David:有兩個點(diǎn)。第一是用戶側(cè):只要有一條片子火了,大家對這個東西買賬且愿意付費(fèi),PMF 就找到了。第二是品牌側(cè):我們談的商業(yè)合作真正完成交付的時(shí)候。
這兩個目前都是 halfway。品牌側(cè)進(jìn)展順利,預(yù)計(jì)在 Q1 就能成單。觀眾側(cè)我們也在不斷打磨內(nèi)容,隨著我們越來越好,一定會出現(xiàn)爆款內(nèi)容。我們正在國內(nèi)外市場同步測試,看哪些內(nèi)容更受歡迎。
Founder Park:品牌側(cè),你們會不會最終變成一個專門接互動廣告的平臺?
David:大的內(nèi)容平臺都會有自己的廣告團(tuán)隊(duì),比如抖音。我們公司有很豐富的廣告行業(yè)背景,我的聯(lián)創(chuàng)也是廣告公司出身的連續(xù)創(chuàng)業(yè)者,所以商業(yè)化這塊我們比很多創(chuàng)業(yè)公司更有經(jīng)驗(yàn)。我的看法是,我們肯定要保持一套相對固定的能力,創(chuàng)作和觀看的核心功能不會為了客戶而改變。但我們會賦能他們的商業(yè)上下游,比如看完廣告后可以跳轉(zhuǎn)到他們的商鋪,或者適配微信、小紅書、TikTok 等不同生態(tài)。我們會為他們做一些周邊開發(fā),但主體能力不會變,這樣就能保證我們不會變成一個每單都定制開發(fā)的狀態(tài)。
Founder Park:現(xiàn)階段給品牌做定制會偏離你們的主線嗎?
David:我覺得它在主線上。新內(nèi)容樣式一定會帶來新廣告樣式,我們做的品牌案例也是在幫用戶更好地接受新內(nèi)容。大品牌如果和我們合作,對用戶教育也是有好處的,能讓更多用戶知道,這種新內(nèi)容樣式是值得信賴和一看的。
其次,品牌商業(yè)化不只是單獨(dú)做一個片子,它可能誕生新的廣告樣式。既然元素可以實(shí)時(shí)生成和改變,我們就可以做 AI 植入。比如劇情里怪獸穿的是 A 品牌球鞋,另一個觀眾看時(shí)可能穿的是 B 品牌。這可以變成一種潛意識的植入,就像電影里的植入廣告一樣。讓廣告主更接受這種形式,其實(shí)也是在幫我們打開未來更大的商業(yè)空間。
Founder Park:廣告業(yè)務(wù)除了帶來收入,還能吸引留住優(yōu)質(zhì)創(chuàng)作者。同時(shí),你們在這里做的技術(shù)和形式上的積累,也能反哺到主平臺。
那現(xiàn)階段除了廣告,你們設(shè)想過主產(chǎn)品的商業(yè)模式嗎?
David:有考慮過。作為工具產(chǎn)品,可以對標(biāo)主流的 AI 工具,走「訂閱 + 按量付費(fèi)」模式為創(chuàng)作者服務(wù),頭部的超創(chuàng)會有無限權(quán)益。從消費(fèi)端看,可以對標(biāo)短劇或視頻打賞、付費(fèi)解鎖交互劇情,甚至可以把打賞融合在劇情和交互里。這些都是可嘗試的方向,但我不能自負(fù)地說哪種一定是主流,可能是一種混合或全新的商業(yè)模式。
07AI 創(chuàng)業(yè),寧愿早一點(diǎn),也不要晚
Founder Park:與競品相比,你們的優(yōu)勢是什么?
David:首先,跑得快肯定是優(yōu)勢。其次,目前我還沒看到競品,但競品一定在路上。另外,一些純做實(shí)時(shí)快速模型和開放世界的產(chǎn)品,可能對我們既有幫助,也有沖擊。你可以在那里玩得很開心,可能就會想,我還需要看你這邊的作品嗎?這些都有待驗(yàn)證。目前那些模型也還沒開放給大眾順暢地玩,質(zhì)量上也還有待提高。
對我來說,做開放世界和做實(shí)時(shí)視頻模型,對用戶的感知最后可能是一回事,就是「我可以在其中操控」,雖然技術(shù)不同,但在用戶場景上可以合在一起。如果他們能合在一起,我們的場景最終會不會也跟他們合在一起?這是需要思考的。當(dāng)然,我更覺得他們會成為我們的助燃劑。
另外,作為一種新的內(nèi)容樣式,必然會對過去的內(nèi)容樣式產(chǎn)生沖擊。如果你不能占據(jù)大家注意力的一部分,就不能稱之為新樣式。我不是說短劇對我們有沖擊,那太自大了,我們能沖擊到他們就很不錯了。我只是說,我們要考慮,大家憑什么看你的東西?你是不是比那些內(nèi)容更有意思?在沒有直接競品的時(shí)候,這些最流行的內(nèi)容樣式就是我們思考、挑戰(zhàn)、去搶奪一塊蛋糕的「競品」。
Founder Park:視頻模型肯定不是你的競品,而今天還沒有出現(xiàn)同類產(chǎn)品,會不會是因?yàn)槟銈兣艿锰缌耍繒羞@種擔(dān)憂嗎?
David:我會有這種擔(dān)憂,但我不覺得這一定是壞事。可能我們前幾次嘗試都是跑得不夠早,這次跑得太早了。但跑得太早這件事情,我覺得一定會發(fā)生。我每次去想這件事的時(shí)候,都覺得它在終局上會是一個世界級、人類級影響力的產(chǎn)品,是下一個 TikTok,會帶來一種新的內(nèi)容消費(fèi)享受。
所以我希望我們是在最早一批提出這個方向時(shí),能在這條路上有自己的一席之地。只要我們一直做對的事情,吸引正確的用戶,和他們一起讓產(chǎn)品越來越好,保持住自己在這個領(lǐng)域的身位,一直活著,就是一件很幸福且重要的事。不能因?yàn)楝F(xiàn)在覺得它早就不做,可能過了幾個月,模型突然有一次大迭代,那就晚了。寧愿早一點(diǎn),也不要晚。
Founder Park:你們堅(jiān)信能活到那個終局。
David:是的,我其實(shí)相信這點(diǎn)。比如我也一直相信 XR 的未來,它只是因?yàn)橛袝r(shí)候太火,資本注入太多,市場太分散了。現(xiàn)在大部分公司其實(shí)還是留著團(tuán)隊(duì)在繼續(xù)做。所以只要你能活到那個時(shí)候,就一定能分到那塊蛋糕和那個新市場。
Founder Park:像 Genie 3 這樣的世界模型,也做的是可交互的開放世界,會擔(dān)心被它們?nèi)〈鷨幔?/strong>
David:它同時(shí)是威脅,也是助推。如果它能達(dá)到那個水平,意味著技術(shù)上也會有相應(yīng)的開源技術(shù)或其它方案能做到,我們接入它,也可以達(dá)到。
而且,我們可能比它在內(nèi)容層面或平臺架構(gòu)上有自己的賣點(diǎn),這些是我們積累了一年的壁壘。比如我們已經(jīng)積累了創(chuàng)作習(xí)慣、創(chuàng)作流程,有創(chuàng)作用戶和觀眾,我們主打的也是高質(zhì)量。如果已經(jīng)有了這個基礎(chǔ),我們再接入它,對我們就是助推。因?yàn)樗赡苓€是一個更泛化的、偏 UGC 的場景,而我們在一個相對 PGC 的環(huán)境里,再去輔助用戶玩,大家可能會覺得還是我們這邊產(chǎn)出的內(nèi)容更有價(jià)值。
08當(dāng)不了 AI Netflix,
當(dāng) AI A24 也很好
Founder Park:你最近焦慮嗎?
David:會。我剛跟我愛人說,我最近很興奮,但也很焦慮。她給我的回復(fù)是「擁抱這種焦慮」。一方面,我是第一次創(chuàng)業(yè),可能有些焦慮在成功人士看來很小兒科。但很多時(shí)候,是對于「感覺能做更多事,但精力或能力有限」的焦慮。比如我睡前會想,還有這么多事情可以做,很想同時(shí)都做了,但這不可能。然后就會想,如果沒做到,會不會有不好的情況發(fā)生。
但后來我咂摸「擁抱焦慮」的感覺,首先盡人事,把認(rèn)為重要的事情按優(yōu)先級排好,最高效地完成它。只要方向是對的,很多事情也不是那么急。我之前會擔(dān)心,如果春節(jié)前不做推廣,會不會馬上就有類似的人做了,那我們就不是第一個了。但后來一想,這事你也不知道。所以還是盡人事,做你該做的事,但不要因?yàn)橥砹艘粌商於^度擔(dān)憂。
Founder Park:與其擔(dān)心漏掉什么,不如確定自己的每一步都是對的,朝著對的方向走。
David:對。而且我有時(shí)候會想,人與人的想法很不一樣。即便我把我的想法告訴你,你照著去做,做出來的可能也是完全不一樣的東西。所以還是堅(jiān)持做你自己在做的事情。
Founder Park:你對于整個產(chǎn)品未來一年的發(fā)展規(guī)劃和預(yù)期是怎樣的?
David:首先,我希望得到用戶側(cè)和商業(yè)上的認(rèn)證。讓世界范圍內(nèi)的觀眾和品牌知道并接受這種新形式,這對我來說是一個里程碑式的、很有意義的事情。其次,在技術(shù)和產(chǎn)品層面要做更多的迭代,根據(jù)用戶反饋去更好地完善觀看和創(chuàng)作的流程。因?yàn)楝F(xiàn)在還是 MVP 版本,門檻高,交互的多樣性和樣式還可以再提升。
Founder Park:三年之后你們的產(chǎn)品會是什么樣子?
David:今年的規(guī)劃是做好用戶和商業(yè)上的兩個驗(yàn)證,以及搭建規(guī)范的創(chuàng)作流程。三年后,我心中一直覺得它是一個「AI Netflix」。我不懷疑技術(shù)會一直迭代,但我感覺 AI 的內(nèi)容思考是嚴(yán)重滯后的。
我蠻期待以 AI 為原始技術(shù)的內(nèi)容,做什么東西好看,能由我們來驗(yàn)證、定義、實(shí)現(xiàn)。我們做的這種交互式視頻,就是 AI 原生內(nèi)容,是真正具備 AI 特性的。探索AI native 的內(nèi)容應(yīng)該長什么樣。我們希望能做出世界級消費(fèi)的這種東西,可以自稱為一個「影業(yè)」的感覺。
Founder Park:所以也不介意把自己定位成「AI Netflix」?
David:我不介意任何標(biāo)簽。雖然沒有哪個標(biāo)簽?zāi)芡耆x你,但至少能讓大家開始了解你。負(fù)面的也還好。在流量市場上總會有正面和負(fù)面的聲音,如果能讓大家記住,即便是負(fù)面的,他也消耗了精力去記你。
Founder Park:如果說,最后沒能成為流媒體霸主 Netflix,而是成了像 HBO 或者 A24 那樣小眾、精品的平臺,你會接受嗎?
David:我會接受。我覺得 A24 很好。我還是蠻在乎做的東西是不是有表達(dá)、有審美。在我看來,技術(shù)會迭代,但藝術(shù)會留下來。我們現(xiàn)在還會去看幾百年前文藝復(fù)興的畫,看 80 年代的電視劇。只要做出好東西,它是可以留下的,這對我來說有很大吸引力。如果你不是一個很大的平臺,但你做的東西有一幫人覺得很有價(jià)值,能留下來,對我來說就是一種成功。
轉(zhuǎn)載原創(chuàng)文章請?zhí)砑游⑿牛篺ounderparker
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.