網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

一年一個(gè)開年核彈，PixVerse R1 讓我想起去年的 DeepSeek R1

2026-01-15 22:08:44　來源: AI異類

北京舉報(bào)

分享至

過去兩年，見證了國產(chǎn)視頻大模型的很多突破。

從底層模型到功能到效果，一點(diǎn)點(diǎn)對(duì)Sora完成了全方位的圍剿。

直到2026年、到現(xiàn)在，最讓我興奮的，是 PixVerse R1。

有點(diǎn)像去年用上 DeepSeek R1 的感覺——這是把游戲規(guī)則改寫了。

01. PixVerse給視頻下了新定義

最牛的公司，有行業(yè)定義能力。

單論視覺消費(fèi)的形態(tài)，好萊塢定義了電影，YouTube定義了互聯(lián)網(wǎng)長(zhǎng)視頻，抖音定義了短視頻。

站在2026年，我想說，PixVerse給AI視頻下了新的定義。

按官方的說法，這是全球首個(gè)真正意義上的「實(shí)時(shí)生成世界模型（Real-time World Model）」。

之前兩三年，AI 視頻領(lǐng)域的主旋律其實(shí)非常單一。

大家都在卷：畫質(zhì)更高一點(diǎn)，時(shí)長(zhǎng)更長(zhǎng)一點(diǎn)，人物一致性再穩(wěn)一點(diǎn)，鏡頭語言再像人類導(dǎo)演一點(diǎn)。

說重要當(dāng)然重要，但它解決的是同一個(gè)問題：如何更好地“生成一個(gè)結(jié)果”。

PixVerse R1讓我覺得，AI視頻，不是AI生圖的視頻版，也不是什么換個(gè)平臺(tái)看AI版的抖音，是一種新形態(tài)。

就像喬布斯定義的iPhone，在產(chǎn)品沒出來前，人們甚至不容易想明白需求到底什么樣。

PixVerse 不像抖音也不像Sora，不像任何一個(gè)已經(jīng)存在的產(chǎn)品，甚至不再把視頻當(dāng)成一個(gè)“靜態(tài)結(jié)果”，第一次，給了一個(gè)可以實(shí)時(shí)交互的、活著的、流式生成的世界。

就好像，以前的《阿凡達(dá)》都是已經(jīng)完成的、鎖死的，但現(xiàn)在，阿凡達(dá)宇宙活了，我也能參與進(jìn)去，并且沒人知道接下來會(huì)發(fā)生啥。

我甚至不知道該把它叫啥，不是游戲、不是AI，像個(gè)開放的個(gè)性內(nèi)容新平臺(tái)。

讓我能站在新世界的中央，世界隨你的意圖變化。

再有代入感，都不如，讓我親身來當(dāng)主角，自己來下定義。

02. 視頻不再是靜態(tài)文件，能隨時(shí)參與

過去所有的視頻，不管是實(shí)拍的，還是 AI 生成的，本質(zhì)上都是一樣的東西：像素點(diǎn)的排列組合，封裝成一個(gè) MP4 或 MOV 文件。

它是死的。一旦生成，就已經(jīng)結(jié)束了。

最多只能在播放層面控制快慢、暫停、回放，但無法介入“發(fā)生本身”。

不能在視頻播放到一半的時(shí)候說：“等一下，讓火大一點(diǎn)”“天黑下來”“這個(gè)角色轉(zhuǎn)過身”。

PixVerse R1 現(xiàn)在可以實(shí)時(shí)生成了。

PixVerse R1里面設(shè)定好的宇宙觀非常豐富，上天入地、神話影視，都有。

而且發(fā)現(xiàn)，上線一天的時(shí)間里，還在新增、還在完善，比如新加的冰山場(chǎng)景就很好玩。

先選擇這個(gè)冰山vlog，開啟體驗(yàn)。

打雪仗、變雪人，都很流暢。

月球漫步這個(gè)，也很有電影感，直接選中就可以。

我嘗試了一下加入新角色，遇到一個(gè)“月球龍”，幾秒鐘視頻就出現(xiàn)了。

操作體驗(yàn)非常簡(jiǎn)單易上手，大家從官網(wǎng)進(jìn)入直接用就行，幾乎不需要操作指南和教程。

很絲滑，而且每一刻的輸入，都會(huì)即時(shí)影響下一刻世界的狀態(tài)。

畫面不是一幀一幀被播放出來的，更像現(xiàn)實(shí)一樣，被連續(xù)地采樣出來、現(xiàn)場(chǎng)此刻發(fā)生。

我的語言、情緒、意圖，可以實(shí)時(shí)驅(qū)動(dòng)PixVerse R1這個(gè)「現(xiàn)實(shí)模擬器」。

能把世界模型做成實(shí)時(shí)的，底層架構(gòu)一定是硬實(shí)力。

這是從系統(tǒng)層、推理層、延遲控制、資源調(diào)度全棧重構(gòu)的結(jié)果，不是調(diào)參能調(diào)出來的。

03. 人人都能渲染游戲？

我第一次真正被 R1 打到，是在一個(gè)非常簡(jiǎn)單、甚至有點(diǎn)幼稚的場(chǎng)景里。

我想要更多游戲化的交互，比如像寶可夢(mèng)里玩法那樣。

于是讓它生成了一只可達(dá)鴨。

畫面出來之后，我沒有停下來重新生成，而是直接開口說：“讓火變藍(lán)色。”

火焰真的在畫面里慢慢變藍(lán)色。

我又說：“天黑下來，紅色光。”

環(huán)境不是純黑，而是像現(xiàn)實(shí)世界一樣，光線逐漸變化。

我說：“它轉(zhuǎn)過身。”

可達(dá)鴨轉(zhuǎn)了過來，看著我。

整個(gè)過程中，沒有重新生成的斷裂感。

除了給定的場(chǎng)景，我也嘗試了一下從零自己寫Prompt，去創(chuàng)造世界。

我給的Prompt是：

一片茂盛的粉色森林，樹葉像粉色的羽毛在微風(fēng)中搖曳。樹干是淡紫色的，掛著發(fā)光的粉色燈籠果實(shí)。一只發(fā)光的粉色小鹿（或者奇異生物）在森林中跳躍，每一步都會(huì)在地面上激起粉色的光暈漣漪。

速度響應(yīng)比我想象要快，不需要切走屏幕，稍等即可。

中間我想讓出現(xiàn)鱷魚，以及更多場(chǎng)景和角色的變化，指令依循度都比較高。

整個(gè)過程就像是你在當(dāng)上帝，隨手一揮，世界就變了。

說實(shí)話，我現(xiàn)在還想象不到它怎么和具身智能結(jié)合。

但這事，我就單純覺得好玩。它有點(diǎn)像小時(shí)候看動(dòng)畫片或者打魂斗羅游戲的那種感覺，我在一個(gè)世界里待著，然后還能通過簡(jiǎn)單的方式控制畫面的走動(dòng)。

傳統(tǒng) AI 視頻，每一次修改，本質(zhì)上都是一次“推翻重來”。

人是站在視頻外面，對(duì)結(jié)果指指點(diǎn)點(diǎn)。

但在 R1 里，我是在視頻里面，像做夢(mèng)一樣，夢(mèng)境在流動(dòng)，而你可以控制夢(mèng)的走向。

那種感覺，非常接近一種“上帝視角”的造物體驗(yàn)。

你不是在使用工具，你是在掌控一個(gè)世界。

04. 交互的背后是技術(shù)：從按鈕到意圖

第二個(gè)讓我后背發(fā)涼的，是交互方式的變化。

我們太習(xí)慣參數(shù)、按鈕、滑桿了：亮一點(diǎn)、暗一點(diǎn)、快一點(diǎn)、慢一點(diǎn)。這是工業(yè)軟件的交互邏輯。

PixVerse R1 完全繞開了這一層。不需要點(diǎn)按鈕，也不用調(diào)參數(shù)，只需要說話。甚至都不需要說得那么精確，只要表達(dá)意圖。

這就有了一個(gè)很重要的轉(zhuǎn)變：用戶不再是“使用者”，而是“共同創(chuàng)作者”。

PixVerse 自己用了一個(gè)詞，叫 Playable Reality。

它既不是視頻，也不是游戲，也不是虛擬世界，但又同時(shí)具備三者的特征。

PixVerse也公開了他們的技術(shù)論文：《PixVerse-R1: Next-Generation Real-Time World Model》。

核心目標(biāo)是：把視頻生成，從“離線片段”，變成“連續(xù)、可交互、實(shí)時(shí)響應(yīng)的視覺流”。

怎么做到的呢？簡(jiǎn)單來說由三部分構(gòu)成：「Omni基座模型 + 無限流式生成架構(gòu) + 實(shí)時(shí)生成引擎」

Omni基座模型，是一個(gè)端到端的原生多模態(tài)模型，把文本、圖像、視頻、音頻統(tǒng)一成連續(xù)的token流。

在訓(xùn)練階段，它學(xué)習(xí)了大量真實(shí)世界的視頻數(shù)據(jù)，因此具備生成復(fù)雜、長(zhǎng)時(shí)間一致場(chǎng)景的能力——也就是我們直觀感受到的“世界感”。

生成機(jī)制上，PixVerse R1采用的是自回歸生成，不是傳統(tǒng)擴(kuò)散模型那種“先算完整片段”的方式。

這意味著，它可以持續(xù)生成、無限延展視覺流，而不是只能吐出一個(gè)固定長(zhǎng)度的視頻。

所以說，表面上是交互或者形式的創(chuàng)新，底層還是技術(shù)，還是新的架構(gòu)設(shè)計(jì)。

05. 作為前字節(jié)人，說說我眼里的PixVerse

說點(diǎn)更個(gè)人的視角。

我不是今天才認(rèn)識(shí)愛詩科技的。V1 到 V5.5，我?guī)缀跬暾娮C了 PixVerse 的進(jìn)化路徑。

24年到25年，那時(shí)我在字節(jié)AI視頻業(yè)務(wù)做產(chǎn)品，也讓我對(duì)外部的創(chuàng)業(yè)團(tuán)隊(duì)，更加佩服，因?yàn)樗麄冋娴挠眠h(yuǎn)比大廠更少的資源，做出了更創(chuàng)新的事和更好的效果

后來，畫面、敘事、穩(wěn)定性一點(diǎn)點(diǎn)被補(bǔ)齊，畫布等等能力，做漫劇都不在話下。

但直到 R1，我才意識(shí)到：他們不只在做一個(gè)視頻模型產(chǎn)品，也在探索 AI 時(shí)代視頻的終極形態(tài)。

這家公司身上有一種我在字節(jié)很熟悉、但到哪都很稀缺的氣質(zhì)——?jiǎng)?wù)實(shí)的浪漫。

他們不滿足于在一個(gè)已知賽道里做到最好，更愿意在所有人都在卷結(jié)果的時(shí)候，跳出來重塑過程和定義本身。

這是非常冒險(xiǎn)的選擇。

也是只有真正的技術(shù)先行者，才敢做的選擇。

2024年初，Sora橫空出世。那時(shí)候，我看到了一個(gè)「AI視頻新物種」。

心里有一種很矛盾的震撼。

一方面，能清楚感覺到，視頻生成這條路，被硬生生往前推了一個(gè)量級(jí)。

畫面、鏡頭、連貫性、敘事能力，第一次看起來像電影，再也不是零散的碎片。

另一方面，我又會(huì)隱約覺得哪里不對(duì)勁——它很強(qiáng)，但它沒有生命、沒有沉浸。

輸入 prompt，等，出結(jié)果；再改 prompt，再等，再出結(jié)果。整個(gè)過程完全是抽卡，是在和模型的隨機(jī)性做等待和對(duì)抗。

我會(huì)反復(fù)問自己一個(gè)問題：這是AI視頻的終點(diǎn)嗎？更自然的更好的交互在哪？

我們真的只是把“拍視頻”這件事，從攝影機(jī)換成了 prompt 嗎？

如果未來真的是虛擬現(xiàn)實(shí)、沉浸式世界、通用 AGI 作為敘事主體，那視頻這種媒介，難道不應(yīng)該是「活著的」嗎？

這個(gè)問題，2025年一整年，我都沒有答案。

今天，PixVerse R1 給出了參考答案。

它帶來的影響，很可能不亞于去年的 DeepSeek R1——它讓一種舊媒介，第一次具備了全新的交互性和游戲性。

如果說去年我們見證了“模型能力的躍遷”，那今年，我們可能正在站在視頻媒介的奇點(diǎn)時(shí)刻。

而這一次，世界不再只是被觀看。

它開始回應(yīng)你了。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點(diǎn)推薦

大模型最難的AI Infra，用Vibe Coding搞定

機(jī)器之心Pro 2026-01-07 15:33:06
0 跟貼 0
讓兩個(gè)大模型在線吵架，跑通全網(wǎng)95%科研代碼｜深勢(shì)Deploy-Master

機(jī)器之心Pro 2026-01-09 14:22:47
0 跟貼 0

DeepSeek狂吞17萬億Tokens？國產(chǎn)AI算力，最關(guān)鍵一戰(zhàn)來了！

新智元 2026-05-29 13:17:47
34 跟貼 34

證據(jù)攤開看，場(chǎng)景圖畫清：讓流式視頻大模型拿捏「何時(shí)開口」

機(jī)器之心Pro 2026-05-26 14:14:25
0 跟貼 0
X平臺(tái)瘋傳！這個(gè)國產(chǎn)開源模型，把信息圖生成整明白了 ? 附實(shí)測(cè)

智東西 2026-05-29 21:57:26
0 跟貼 0

剛剛，智元拿下WorldArena世界模型總分冠軍！

機(jī)器之心Pro 2026-05-29 21:54:56
0 跟貼 0

科技巨頭瘋狂搶電，卻沒人看懂真正的戰(zhàn)場(chǎng)

DeepTech深科技 2026-05-29 19:11:07
0 跟貼 0
DeepSeek V4芯模協(xié)同背后，國產(chǎn)算力生態(tài)開始飛輪加速

量子位 2026-05-28 21:33:32
2 跟貼 2

中印邊境總是冷兵器“打群架”，手握核彈殲20，為何絕不輕用？

這個(gè)真行 2026-05-28 18:47:35
0 跟貼 0
北工大連爆“核彈”！又站上風(fēng)口浪尖！

京城教育圈 2026-05-29 20:37:43
0 跟貼 0
德云社把處罰楊鶴通內(nèi)部文件公之于眾，殺雞儆猴外還有更大企圖

楓哥閑談 2026-05-29 16:13:26
13 跟貼 13
藍(lán)色起源的NG4火箭炸了

南海的波濤 2026-05-29 19:39:36
0 跟貼 0
孩子去“光頭強(qiáng)家”，對(duì)著床上被子一頭栽下去，沒想到是模型！

笑出豬叫的趣聞閣 2026-05-26 17:08:43
1 跟貼 1
俄炸基輔意在澤連斯基，核彈瞄準(zhǔn)星鏈，俄羅斯拼死一搏

四夕君 2026-05-29 22:50:18
1 跟貼 1
核彈的發(fā)射手續(xù)有多復(fù)雜？需要經(jīng)過哪些程序？

軍情觀察家 2026-05-29 15:31:46
0 跟貼 0
全球僅剩一架！最快戰(zhàn)轟“女武神”，搭載14枚核彈造價(jià)頂3艘航母

迷彩前沿 2026-05-28 16:18:04
0 跟貼 0
杭州公園引入“黑科技”：一天抓7000多只蚊子！“河邊坐一個(gè)半小時(shí)沒被咬”“我都想買一個(gè)放家里”

都市快報(bào)橙柿互動(dòng) 2026-05-29 09:17:46
5474 跟貼 5474
小男孩經(jīng)過多次思考后終于跳上平臺(tái)，網(wǎng)友：看到了小時(shí)候的自己

學(xué)申論的談妹 2026-05-29 03:00:38
189 跟貼 189
神舟二十二號(hào)載人飛船順利撤離空間站組合體

央視新聞客戶端 2026-05-29 14:55:45
1237 跟貼 1237
優(yōu)衣庫等品牌收集非必要個(gè)人信息被通報(bào)

封面新聞 2026-05-29 12:10:44
1842 跟貼 1842
再被曝光“圈路收費(fèi)”的瀘沽湖景區(qū)：已開通過境車輛專用通道

南方都市報(bào) 2026-05-29 17:10:06
966 跟貼 966
官方通報(bào)低保老人被貸款20萬

看看新聞Knews 2026-05-29 15:25:38
1173 跟貼 1173
稻城亞丁景區(qū)問題，最新通報(bào)

云南網(wǎng)絡(luò)廣播電視臺(tái) 2026-05-29 09:45:59
1249 跟貼 1249
為什么說比亞迪這次的兜底，要比堆參數(shù)更狠？

愛活網(wǎng)Evolife 2026-05-29 16:45:05
11 跟貼 11
圖靈獎(jiǎng)得主Sutton：用1967年的公式，解決流式強(qiáng)化學(xué)習(xí)一大缺陷

機(jī)器之心Pro 2026-05-11 09:55:21
0 跟貼 0
別再卷參數(shù)價(jià)格了！這1000臺(tái)百萬公里本田車，才是車企該有的樣子

車載娛樂 2026-05-28 16:58:06
1 跟貼 1
網(wǎng)線被人拔斷、傳感器被阻斷，瓦斯監(jiān)測(cè)為何失效？

中國新聞周刊 2026-05-29 13:28:03
84 跟貼 84
歐盟官員：中國占全球制造業(yè)的份額已從6%增長(zhǎng)到30%

澎湃新聞 2026-05-29 14:22:13
656 跟貼 656
把人踢下樓生意就好了，這是什么邏輯啊

新大陸影視 2026-05-29 11:20:37
1 跟貼 1
阿里、字節(jié)、胖東來都在合作的牛肉粉品牌，到底長(zhǎng)什么樣？

餐飲項(xiàng)目拆解 2026-05-27 15:00:00
0 跟貼 0
SpaceX星艦?zāi)Ｐ驼娴拇林形伊耍?斤重的304不銹鋼材質(zhì)，全鏡面工藝摸起來超有質(zhì)感，擺在那兒就顯得

制造科技 2026-05-28 18:27:19
17 跟貼 17
貴州大學(xué)招聘管理崗引質(zhì)疑，要求配偶須是本校在職博士，校方：不是“蘿卜崗”

封面新聞 2026-05-29 16:08:24
44 跟貼 44
安世中國獨(dú)立運(yùn)營(yíng)體系已基本完成搭建

財(cái)聯(lián)社 2026-05-29 10:57:08
924 跟貼 924
幼兒園集中用餐新規(guī)：飯菜燒熟到食用不得超2小時(shí)

央視新聞 2026-05-29 16:10:22
698 跟貼 698
收評(píng)：創(chuàng)業(yè)板指跌2.11% 大消費(fèi)板塊走強(qiáng)

證券時(shí)報(bào) 2026-05-29 15:22:05
692 跟貼 692
C-130引擎模型！可變槳！可調(diào)速！收藏級(jí)還原太酷了#航模

制造科技 2026-05-29 08:05:14
0 跟貼 0
煙臺(tái)一企業(yè)所售雞蛋獸藥超標(biāo)69倍

現(xiàn)代快報(bào) 2026-05-29 17:09:28
244 跟貼 244
伊知情人士：伊朗尚未就伊美協(xié)議作出最終決定

澎湃新聞 2026-05-30 00:14:16
0 跟貼 0
COD新作預(yù)購，真實(shí)槍戰(zhàn)來了

IT之家 2026-05-29 09:08:17
40 跟貼 40
DeepSeek認(rèn)為嬰兒時(shí)期最幸福的十個(gè)瞬間

旦旦電影啊 2026-05-28 12:10:44
1 跟貼 1

“一定要投”！摩根士丹利明確看好A股硬科技，外資加速回流，中國資產(chǎn)戰(zhàn)略配置正當(dāng)其時(shí)

AI異類

從硅谷到中關(guān)村，AI信息與測(cè)評(píng)

188文章數(shù) 8關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

手機(jī)

親子

房產(chǎn)

家居

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

一年一個(gè)開年核彈，PixVerse R1 讓我想起去年的 DeepSeek R1

Claude Opus 4.8凌晨突發(fā)上線

釋永信被判24年 中國佛教協(xié)會(huì)：完全是咎由自取

釋永信被判24年 中國佛教協(xié)會(huì)：完全是咎由自取

即使是文班亞馬，也做不到這件事

奚夢(mèng)瑤何猷君將于6月在法國舉行婚禮

近3個(gè)月跌超20% 黃金"猴市"下的眾生相

900V+3.2秒破百 領(lǐng)克10+&領(lǐng)克10上市16.99萬元起

態(tài)度原創(chuàng)

六一出行報(bào)告：景區(qū)門票預(yù)訂大漲，拼豆搜索量同比增長(zhǎng)10倍

華為雙箭齊發(fā)：Mate80系列618官降500元，闊比例直板新機(jī)曝光！

為了讓孩子變“超模臉”，每天徒手?jǐn)U顎、暴力正頜？外國媽媽卷瘋了！

順德澐璟「澐冠」再出圈：頂階人群不是買房，是追加“傳世資產(chǎn)”

云棲 舒展如流云

釋永信被判24年中國佛教協(xié)會(huì)：完全是咎由自取

釋永信被判24年中國佛教協(xié)會(huì)：完全是咎由自取

900V+3.2秒破百領(lǐng)克10+&領(lǐng)克10上市16.99萬元起

云棲舒展如流云