<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Artificial Analysis 榜單第二,SkyReels-V4 宣告 AI 視頻進入「全棧統(tǒng)一」階段

      0
      分享至

      Seedance 2.0 還在持續(xù)震驚行業(yè)的時候,AI 視頻賽道又有一份權(quán)威榜單刷新了,來自昆侖天工的 SkyReels-V4 沖進了最前列。

      Artificial Analysis 是目前 AI 領(lǐng)域最有公信力的第三方評測平臺之一。它的機制,是讓不同模型生成答案,然后由真人用戶盲選投票,誰的作品被選中的次數(shù)多,誰的 ELO 分就高。整個過程不看品牌,不接受企業(yè)自報成績,OpenAI、Google 這些大廠都在上面被公開打分。

      在這份最新的文生視頻榜單(帶音頻)上,SkyReels-V4 排到了第二。ELO 評分 1090,僅落后第一名快手 Kling 3.0 Pro 三分。Google Veo 3.1、OpenAI Sora 2、xAI grok-imagine-video 都排在了它的身后。


      在包含所有歷史版本的全量排名里,SkyReels-V4 也排到了第四。


      值得注意的是,Text To Video Leaderboard(with Audio)不是一個只看「畫面好不好看」的榜單,它評的是帶音頻的完整視頻,畫面、聲音、兩者的同步程度,全都算分。

      SkyReels-V4 能在這個維度拿到全球第二,說明它做對了一些和大多數(shù)視頻模型不太一樣的事情。

      ??關(guān)注 Founder Park,最及時最干貨的創(chuàng)業(yè)分享

      超 22000 人的「AI 產(chǎn)品市集」社群!不錯過每一款有價值的 AI 應(yīng)用。

      邀請從業(yè)者、開發(fā)人員和創(chuàng)業(yè)者,飛書掃碼加群:

      進群后,你有機會得到:

      • 最新、最值得關(guān)注的 AI 新品資訊;

      • 不定期贈送熱門新品的邀請碼、會員碼;

      • 最精準(zhǔn)的 AI 產(chǎn)品曝光渠道

      01萬物可參考」的創(chuàng)作自由

      要理解 SkyReels-V4 的能力,最直觀的方式是看一個案例。

      上傳一段邁克爾?杰克遜的經(jīng)典舞蹈視頻和一張二次元圖片,告訴模型:把舞者替換成這個角色。


      幾秒鐘后,視頻里的舞者變成了那個動漫人物,但每一個轉(zhuǎn)身和手勢的時機都和原版嚴(yán)絲合縫。

      這已經(jīng)很厲害了,但還沒完。換一張狼的圖片再試一次。

      這回模型需要把一個人類的舞蹈動作,映射到一只四足動物身上。結(jié)果狼的動作流暢自然,身體的重心轉(zhuǎn)移和節(jié)拍卡點依然對得上原視頻。

      這說明模型不止是抓取像素的外觀,更是本質(zhì)上理解了動作的語義。

      難度還可以繼續(xù)升級。例如《低俗小說》里烏瑪?瑟曼和約翰?特拉沃爾塔的經(jīng)典扭扭舞,給模型兩張圖:一只狗,一只貓。指令是把左邊的舞者換成狗,右邊的換成貓。


      這個任務(wù)的挑戰(zhàn)在于,模型必須同時跟蹤兩個主體的運動軌跡,分別完成替換,還不能把兩邊的動作搞混。

      SkyReels-V4 交出的結(jié)果是:狗和貓各跳各的,動作和原版舞者一一對應(yīng),互不干擾。

      這套能力叫「運動參考」。對于短視頻創(chuàng)作來說,它的想象潛力巨大。一旦你有了一段動作素材作為骨架,就可以把任何形象「穿」上去。同一段舞蹈,今天換成品牌 IP 角色做一版廣告素材,明天換成二次元形象做一版粉絲二創(chuàng),后天換成吉祥物做一版節(jié)日版本。

      對于短視頻創(chuàng)作者和內(nèi)容團隊來說,這意味著素材的復(fù)用率被大幅拉高,同一段動作的商業(yè)價值可以被反復(fù)釋放。

      02全棧能力:整個工作流,一個模型搞定

      運動參考只是 SkyReels-V4 多模態(tài)參考能力的一個切面。這個模型真正的野心,是覆蓋整條視頻創(chuàng)作工作流。從生成到編輯,從畫面到聲音,在一個模型里全部完成。

      先看短劇生成。給模型兩三張人物照片,再給一段對話劇本,它能直接輸出一個帶對白、帶背景音樂、有正反打鏡頭切換的短劇片段。


      注意了,這是一個真的有鏡頭語言的視頻。男人說話的時候鏡頭對著男人,切到老人的反應(yīng),再切回來,節(jié)奏是對的。

      更值得關(guān)注的是音頻部分。生成出來的臺詞清晰度很高,口型都對。而且?guī)в星榫w,緊張、警惕、懷疑,這些在劇本里寫的情緒指令,模型都能在語音層面體現(xiàn)出來。仔細(xì)聽還能聽到緊張懸疑的背景音樂,完全契合劇情。這種音頻質(zhì)量放在一年前,單獨拿出來都算得上一個獨立產(chǎn)品的賣點。

      而且它不只支持中文,英文、法語、日語,每種語言的語音都可以由模型原生生成。這意味著同一套角色素材,換一種語言的劇本就能產(chǎn)出另一個版本,對做海外內(nèi)容的團隊來說效率提升非常明顯。



      同樣,在視頻編輯方面,去水印、抹掉硬字幕、清理臺標(biāo),也都能輕松搞定。

      快速去除字幕

      這些過去要靠 After Effects 或者好幾個 AI 小工具拼在一起才能完成的操作,現(xiàn)在一個模型、一條指令就能搞定。

      它還能做更復(fù)雜的事情:給一段女團舞蹈視頻里的 C 位舞者憑空加上一頂帽子。


      帽子的顏色和細(xì)節(jié)都跟參考圖一致,整段舞蹈就像她本來就戴著這頂帽子跳的。

      或者反過來,從一段多人探險視頻里把兩個人直接刪掉,刪完之后背景自然補全,沒有任何穿幫痕跡。

      從生成完整短劇到精細(xì)化編輯修復(fù),SkyReels-V4 試圖讓創(chuàng)作者的工具箱大幅簡化:過去需要在好幾個軟件之間來回切換才能完成的工作流,現(xiàn)在可以在一個模型內(nèi)完成。

      03魔法背后的技術(shù)力

      前面展示了這么多能力,一個自然的問題是:為什么這些事情能在同一個模型里完成?

      答案藏 昆侖天工 SkyReels-V4 的技術(shù)報告里。如果只挑兩個最關(guān)鍵的技術(shù)點來講,統(tǒng)一拼接框架解釋了「為什么一個模型能干這么多事」,雙流 MMDiT 架構(gòu)解釋了「音視頻怎么做到真正同步的」。


      論文:https://arxiv.org/pdf/2602.21818

      先說第一個。SkyReels-V4 之所以能用一個模型干這么多事,核心在于它把所有視頻任務(wù)都變成了同一種操作。

      具體怎么做的?模型的輸入被拆成三樣?xùn)|西拼在一起:一段待生成的視頻底片、你提供的條件畫面、以及一張遮罩。

      遮罩的作用是標(biāo)記哪些區(qū)域保留,哪些讓模型重新生成。文生視頻就是遮罩全空;圖生視頻就是第一幀鎖定;去水印就是把水印的區(qū)域挖掉。任務(wù)千差萬別,但在模型眼里只是遮罩的配置不同。

      參考素材的注入是另一個維度。如果你提供了角色照片或動作視頻,這些素材會被編碼后拼在生成序列的前面,像一本攤開的參考手冊。模型生成每一幀時都能回頭翻看,從中提取外觀、動作和風(fēng)格信息。這就是為什么你可以同時給它一張角色圖和一段舞蹈視頻,它能理解「用這個外觀,跳那段舞」。

      兩層拼接配合在一起,就有了一個真正統(tǒng)一的接口:生成、編輯、遷移,全部走同一套框架,同一套參數(shù)。

      再說第二個。大多數(shù)視頻模型生成畫面之后,音頻是后面單獨加上去的,兩者之間的對齊靠的是后處理。

      SkyReels-V4 不是這么做的,它的架構(gòu)叫「雙流 MMDiT」:視頻和音頻各有一條生成線,但這兩條線在每一步都能互相看到對方在做什么。


      打個比方,就像兩個樂手看著同一份樂譜在合奏:視頻這邊畫到嘴巴張開,音頻那邊就同步輸出對應(yīng)的語音;音頻這邊的節(jié)拍到了重音的位置,視頻那邊的動作也跟著卡點。兩條線共享同一個文本編碼器來理解指令,再通過雙向交叉注意力機制在每一步互相校準(zhǔn)。

      但這里有一個工程上的難題:視頻和音頻的時間尺度完全不同。視頻一秒 32 幀,音頻一秒 44100 個采樣點,兩者的信息密度差了好幾個數(shù)量級。

      SkyReels-V4 用了一個叫 RoPE 頻率縮放的技術(shù)來解決這個問題。本質(zhì)上是讓音頻的時間坐標(biāo)系「壓縮」到和視頻對齊,確保兩邊在注意力計算的時候看到的是同一個時間軸上的對應(yīng)位置。

      這就是為什么前面短劇案例里,多角色對話的唇形和語音能做到毫秒級的精準(zhǔn)對齊,因為音視頻從生成機制的底層就是綁定在一起的。

      04從工具替代到工作流統(tǒng)一

      把視角拉遠(yuǎn)一點看,昆侖天工 SkyReels-V4 做的這件事,其實是整個 AI 行業(yè)正在發(fā)生的一個大趨勢的縮影。

      語言模型從純文本走向多模態(tài),圖像模型從生成走向理解,視頻模型從單項能力走向全流程覆蓋,所有方向都在往「統(tǒng)一」這個詞收斂。SkyReels-V4 的統(tǒng)一框架不只是一家公司的技術(shù)選擇,它更像是視頻生成賽道演進方向的一個信號。

      對創(chuàng)作者來說,這種變化的體感可能比技術(shù)敘事更直接。過去做一條完整的視頻內(nèi)容,工作流是「工具鏈串聯(lián)」:用這個工具生成畫面,用那個工具配音樂,再換一個工具做剪輯和后期。每切換一次工具就丟失一次上下文,素材在不同軟件之間反復(fù)導(dǎo)入導(dǎo)出。

      SkyReels-V4 則是讓這條鏈變成一個框:所有素材進去,成品出來,中間模型始終理解你在做什么。創(chuàng)作的門檻在降低,但更重要的是,創(chuàng)作的連貫性在提升。

      對更廣泛的影視和內(nèi)容制作行業(yè)來說,影響可能比「換一個更好用的工具」更深。傳統(tǒng)影視后期是一條高度分工的流水線。特效、配音、音效設(shè)計、字幕處理,每個環(huán)節(jié)對應(yīng)專門的軟件、專門的人才、專門的外包預(yù)算。當(dāng)一個模型能同時覆蓋這些過去分屬不同工種的任務(wù),產(chǎn)業(yè)鏈里一部分中間環(huán)節(jié)的存在邏輯就開始松動了。

      尤其在短劇、短視頻、品牌內(nèi)容、電商素材這些對產(chǎn)出速度和成本高度敏感的中腰部市場,制作的「最低可行團隊」正在被重新定義。過去需要十個人干一周的活,現(xiàn)在可能三個人加一個統(tǒng)一模型,兩天就能交付。當(dāng)然,高端影視制作對精度和創(chuàng)意的要求,靠當(dāng)前 AI 還不能完全替代,但「全棧統(tǒng)一」的意義已經(jīng)從技術(shù)架構(gòu)的故事,變成了產(chǎn)業(yè)效率的故事。

      回到昆侖天工自身,SkyReels 系列的迭代節(jié)奏也值得留意。V1 主攻人物表演和影視級質(zhì)感,是中國最早面向 AI 短劇創(chuàng)作的垂直場景視頻生成模型;V2 引入自回歸擴散架構(gòu),實現(xiàn)了無限時長的連續(xù)視頻生成;V3 強化了多模態(tài)參考驅(qū)動,支持圖像、視頻、音頻等多種條件輸入;到了 V4,音視頻聯(lián)合生成和全場景統(tǒng)一編輯被裝進同一個架構(gòu)。每一步都不是在某個單項上刷分,而是在把更多能力往同一個框架里收。

      這條路不輕松。統(tǒng)一意味著每一代都要做架構(gòu)層面的改動,而不是在已有框架上微調(diào);意味著要同時把生成質(zhì)量、編輯精度、音頻同步這些互相制約的指標(biāo)都拉上來。但走到 V4 這一步,Artificial Analysis 第二的成績單至少說明了一件事:這條「把所有東西裝進一個模型」的路,昆侖天工走通了。


      轉(zhuǎn)載原創(chuàng)文章請?zhí)砑游⑿牛篺ounderparker

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      兒子說想給自己做床蠶絲被,一家三口網(wǎng)購了1萬粒蠶卵!如今12000條蠶寶寶每天要吃30斤桑葉……媽媽:崩潰并快樂著

      兒子說想給自己做床蠶絲被,一家三口網(wǎng)購了1萬粒蠶卵!如今12000條蠶寶寶每天要吃30斤桑葉……媽媽:崩潰并快樂著

      都市快報橙柿互動
      2026-05-19 00:29:55
      為什么75寸電視才2500?不是買不起,是真的沒必要買

      為什么75寸電視才2500?不是買不起,是真的沒必要買

      老特有話說
      2026-05-18 16:32:15
      特朗普:可能不得不再給伊朗猛烈一擊!北約也設(shè)下最后期限:若霍爾木茲海峽7月初未開放,將考慮護航

      特朗普:可能不得不再給伊朗猛烈一擊!北約也設(shè)下最后期限:若霍爾木茲海峽7月初未開放,將考慮護航

      每日經(jīng)濟新聞
      2026-05-20 00:56:10
      萬萬沒想到,特朗普又立“大功”,大量頂尖人才被他“送回”中國

      萬萬沒想到,特朗普又立“大功”,大量頂尖人才被他“送回”中國

      愛意隨風(fēng)起呀
      2026-05-19 20:14:30
      女人最吃的這幾種肢體觸摸,第二種一摸就心動,五十歲以上更管用

      女人最吃的這幾種肢體觸摸,第二種一摸就心動,五十歲以上更管用

      匹夫來搞笑
      2026-05-20 00:56:06
      情侶遛狗時發(fā)現(xiàn)湖里鴨子發(fā)出喵喵叫,一看竟是鴨子馱著幼貓在游動

      情侶遛狗時發(fā)現(xiàn)湖里鴨子發(fā)出喵喵叫,一看竟是鴨子馱著幼貓在游動

      半島晨報
      2026-05-19 13:15:03
      生意太好被處處刁難,屠夫6天殺13人,公安部A級通緝犯石悅軍落網(wǎng)

      生意太好被處處刁難,屠夫6天殺13人,公安部A級通緝犯石悅軍落網(wǎng)

      易玄
      2026-05-18 23:06:35
      爆雷!知名品牌天津店跑路?全國多地消費者維權(quán)!收了錢不回復(fù)!

      爆雷!知名品牌天津店跑路?全國多地消費者維權(quán)!收了錢不回復(fù)!

      天津生活通
      2026-05-19 21:05:01
      商家稱校園買家購45把雨傘全損退貨!校方:好像有班級運動會用了 具體還需再核實

      商家稱校園買家購45把雨傘全損退貨!校方:好像有班級運動會用了 具體還需再核實

      閃電新聞
      2026-05-19 21:34:39
      隨著馬刺勝雷霆,1-0領(lǐng)先,我必須承認(rèn)5個現(xiàn)實:總冠軍失去懸念

      隨著馬刺勝雷霆,1-0領(lǐng)先,我必須承認(rèn)5個現(xiàn)實:總冠軍失去懸念

      籃球掃地僧
      2026-05-19 14:00:14
      深度科普:狗交配過程為何會很難分開?下次看到狗交配請默默離開

      深度科普:狗交配過程為何會很難分開?下次看到狗交配請默默離開

      宇宙時空
      2026-05-18 17:30:14
      美國百萬顏值網(wǎng)紅出庭受審,卻被英俊法官氣場碾壓,引全網(wǎng)熱議

      美國百萬顏值網(wǎng)紅出庭受審,卻被英俊法官氣場碾壓,引全網(wǎng)熱議

      譯言
      2026-05-19 08:18:57
      35萬的瑪莎拉蒂,刺痛了多少豪車玩家!

      35萬的瑪莎拉蒂,刺痛了多少豪車玩家!

      蔣東文
      2026-05-19 21:24:32
      垃圾食品清單已列出,燕麥片排第2,排第1的很多人喜歡吃

      垃圾食品清單已列出,燕麥片排第2,排第1的很多人喜歡吃

      路醫(yī)生健康科普
      2026-05-17 19:35:03
      2026必知:強奸、通奸、嫖娼,法律定性與處罰全解讀

      2026必知:強奸、通奸、嫖娼,法律定性與處罰全解讀

      周哥一影視
      2026-05-19 14:15:11
      在岸人民幣兌美元較周一夜盤收盤跌127點

      在岸人民幣兌美元較周一夜盤收盤跌127點

      財聯(lián)社
      2026-05-20 03:10:12
      馬斯克再放話:年底全美鋪開無人出租車,德州僅30輛

      馬斯克再放話:年底全美鋪開無人出租車,德州僅30輛

      碳基打工人
      2026-05-19 00:42:10
      上次奪冠還是大帝時代,阿森納傳奇亨利轉(zhuǎn)發(fā)球隊奪冠海報

      上次奪冠還是大帝時代,阿森納傳奇亨利轉(zhuǎn)發(fā)球隊奪冠海報

      懂球帝
      2026-05-20 06:25:33
      8黃代價!海港“臟”戰(zhàn)術(shù)擊倒成都蓉城,急了:劉殿座轉(zhuǎn)身射門

      8黃代價!海港“臟”戰(zhàn)術(shù)擊倒成都蓉城,急了:劉殿座轉(zhuǎn)身射門

      足球大腕
      2026-05-19 23:27:04
      黃仁勛貼身女助理身份曝光!哈佛畢業(yè)年薪125萬美金,亞裔學(xué)霸

      黃仁勛貼身女助理身份曝光!哈佛畢業(yè)年薪125萬美金,亞裔學(xué)霸

      魔都姐姐雜談
      2026-05-18 19:18:22
      2026-05-20 06:36:49
      FounderPark incentive-icons
      FounderPark
      關(guān)注AI創(chuàng)業(yè),專注和創(chuàng)業(yè)者聊真問題
      1217文章數(shù) 162關(guān)注度
      往期回顧 全部

      科技要聞

      馬斯克敗訴,法院判他起訴OpenAI太晚了

      頭條要聞

      媒體:特朗普為何拋涉臺"四不"說法 魯比奧解釋清楚了

      頭條要聞

      媒體:特朗普為何拋涉臺"四不"說法 魯比奧解釋清楚了

      體育要聞

      文班亞馬:沒拿到MVP,就證明自己是MVP

      娛樂要聞

      姚晨刪博難平眾怒,為什么她還能蹦噠

      財經(jīng)要聞

      潔麗雅硬剛豪門內(nèi)斗傳言

      汽車要聞

      煥新極氪009上市41.38萬起 齊家版讓MPV回歸家庭

      態(tài)度原創(chuàng)

      藝術(shù)
      數(shù)碼
      家居
      手機
      公開課

      藝術(shù)要聞

      李克農(nóng)將軍書法,字字皆是大將風(fēng)范!

      數(shù)碼要聞

      谷歌推出Gemini 3.5系列模型

      家居要聞

      觀山隱秀 心靈沉淀

      手機要聞

      5月最后十天,5款新機連番轟炸!從電競旗艦到中端影像都齊了

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 国产av夜夜欢一区二区三区| 99久久国产综合精品色| 亚洲va中文字幕无码久久| 日韩精品一二区在线视频| 国产乱子伦一区二区三区视频播放 | 日韩av激情在线| 亚洲一本大道无码AV天堂| 精东A片成人影视| 亚洲成av人片在www鸭子| 国产日韩av二区三区| 亚洲AV无码久久精品国产老人| 亚洲精品在线成人| 亚洲愉拍99热成人精品热久久| 久无码久无码av无码| 国产久9视频这里只有精品| 精品国产这么小也不放过| 超碰性爱| 亚洲综合天堂一区二区三区| 国产精品久久久久亚洲| 久福利| 男人天堂亚洲天堂女人天堂| 国产色a在线观看| AV一区二区三区| 香港国产av| 九九日日夜夜| 久久久橹橹橹久久久久高清| 麻豆A?V视频| 日韩精品亚洲专在线电影| 国产成人av一区二区三| 一起草av| 亚洲欧洲av综合色无码| 国产日韩欧美精品一区二区三区| 国产精品一区二区不卡| 亚洲成a人在线播放www| 亚洲一区二区三区在线播放无码| 欧洲午夜视频| 国产福利影院在线观看| 国产丝袜打飞机免费在线| 国产精品伦人视频免费看| 91丨露脸丨熟女精品| 大方县|