![]()
4月27日晚間,阿里巴巴視頻生成模型HappyHorse 1.0正式開(kāi)啟灰測(cè),官網(wǎng)(happyhorse.cn)向全球?qū)I(yè)創(chuàng)作者和企業(yè)用戶開(kāi)放注冊(cè),大眾用戶則可通過(guò)千問(wèn)App入口體驗(yàn)。距離它以匿名身份屠榜全球AI視頻評(píng)測(cè)平臺(tái)Artificial Analysis,不過(guò)三周時(shí)間。從神秘黑馬到正式開(kāi)門(mén)迎客,這匹馬跑出了國(guó)內(nèi)AI視頻產(chǎn)品里少見(jiàn)的冷啟動(dòng)速度。
1 · 架構(gòu)的實(shí)質(zhì)性差異
4月7日深夜,一個(gè)叫"HappyHorse-1.0"的匿名模型悄無(wú)聲息出現(xiàn)在ArtificialAnalysis的Video Arena榜單上,連公司背書(shū)都沒(méi)有,直接拿下文生視頻和圖生視頻兩張榜的榜首。文生視頻ELO評(píng)分1384,領(lǐng)先字節(jié)Seedance2.0超過(guò)100分;圖生視頻1413,刷新該平臺(tái)歷史紀(jì)錄。全球AI圈隨即炸鍋,"偵探們"從技術(shù)路線、語(yǔ)言排序、命名方式多線并進(jìn)排查,官網(wǎng)里普通話和粵語(yǔ)排在英語(yǔ)前面這個(gè)細(xì)節(jié),率先鎖定了中國(guó)團(tuán)隊(duì)。
4月10日,阿里ATH創(chuàng)新事業(yè)部正式認(rèn)領(lǐng)。這款模型出自阿里副總裁鄭波團(tuán)隊(duì),"可靈之父"張迪2025年底回歸阿里后,在相關(guān)方向亦有參與布局。
快樂(lè)馬的技術(shù)賣(mài)點(diǎn)是"原生音視頻聯(lián)合生成",150億參數(shù)、40層單流自注意力Transformer,把文本、視頻、音頻的token統(tǒng)統(tǒng)壓進(jìn)同一個(gè)序列聯(lián)合訓(xùn)練,中間32層參數(shù)共享。
這和Seedance 2.0"先生成無(wú)聲視頻、再單獨(dú)配音對(duì)齊"的兩階段流程是根本性的路線差異,音畫(huà)不是拼出來(lái)的,是從同一次推理里長(zhǎng)出來(lái)的。支持7種語(yǔ)言的原生口型同步、15秒多鏡頭敘事、視頻二次編輯,是灰測(cè)版本已經(jīng)具備的功能集。
2 · 實(shí)測(cè):楊過(guò)打李小龍,等了5分鐘
理論參數(shù)之外,真實(shí)用戶的體感更直接。筆者用快樂(lè)馬生成了一段楊過(guò)與李小龍對(duì)打的短視頻:兩個(gè)來(lái)自完全不同時(shí)空和武打體系的人物,在同一畫(huà)面里展開(kāi)對(duì)決。整個(gè)生成過(guò)程耗時(shí)接近5分鐘。
官方實(shí)驗(yàn)室環(huán)境下H100跑38秒一條的參數(shù),到了消費(fèi)端疊加服務(wù)器排隊(duì)、灰測(cè)階段算力資源尚未充分鋪開(kāi)等變量,這個(gè)等待時(shí)長(zhǎng)并不算離譜,但隨著用戶量增加,這個(gè)時(shí)長(zhǎng)或許還會(huì)延長(zhǎng)。
生成結(jié)果里有幾個(gè)細(xì)節(jié),把快樂(lè)馬現(xiàn)階段的能力邊界說(shuō)得很清楚。李小龍的面部還原比較準(zhǔn)確,辨識(shí)度高,這并不意外,訓(xùn)練數(shù)據(jù)里李小龍的影像資料極為豐富,模型對(duì)真實(shí)存在的歷史人物有充分的"記憶"可以調(diào)用。但楊過(guò)完全是另一回事,畫(huà)面里的那個(gè)人更像是模型隨機(jī)拼湊出來(lái)的古裝男性,與金庸筆下那個(gè)獨(dú)臂大俠的設(shè)定幾乎沒(méi)有關(guān)聯(lián),這暴露了模型對(duì)純文學(xué)虛構(gòu)人物的理解仍停留在字面層面,缺乏足夠的形象錨點(diǎn)。
![]()
更值得關(guān)注的是武器。整段視頻里,雙方手持的道具出現(xiàn)了明顯的時(shí)序漂移,李小龍前段持棍,后段變成了鐵鏈;楊過(guò)拿的是刀,而不是他標(biāo)志性的玄鐵重劍。這類(lèi)"幻覺(jué)"是典型的物體一致性缺失。
![]()
多鏡頭敘事里,模型需要在時(shí)間軸上持續(xù)追蹤同一物體的形態(tài)和位置,這是當(dāng)前幾乎所有視頻生成模型共同面對(duì)的技術(shù)難題,但武器在前后鏡頭間直接換了種類(lèi),還是超出了合理容錯(cuò)范圍。
不過(guò)人物臉部和服裝細(xì)節(jié)的精細(xì)度相當(dāng)不錯(cuò),模型對(duì)"人"的處理明顯優(yōu)于對(duì)"物"的處理,算力分配的優(yōu)先級(jí)在這里體現(xiàn)得很直白。
3 · 價(jià)格:比預(yù)期親民
刊例價(jià)720P視頻0.9元/秒,1080P為1.6元/秒;訂閱會(huì)員后兩檔分別降至0.44元和0.78元每秒。官網(wǎng)同時(shí)提供三檔訂閱方案:免費(fèi)檔每日登錄贈(zèng)送少量積分(100積分,約夠生成1條10秒視頻);標(biāo)準(zhǔn)會(huì)員限時(shí)折扣后48元/月,每月800積分;高級(jí)會(huì)員188元/月,每月3600積分,折算約合1800張MJ級(jí)別的生圖量。
![]()
這套定價(jià)和此前內(nèi)測(cè)階段流出的"1秒1美元"版本相比大幅調(diào)低,48元/月的入門(mén)檔在國(guó)內(nèi)AI創(chuàng)作工具里屬于中低價(jià)位,策略上是在拉規(guī)模而非榨利潤(rùn)。
但有一個(gè)細(xì)節(jié)值得留意:積分用"MJ生圖數(shù)量"做換算參照,視頻生成和圖片生成的算力消耗完全不在同一量級(jí),實(shí)際能生成多長(zhǎng)的視頻,用戶自己得先把賬算明白。"更多權(quán)益敬請(qǐng)期待"在標(biāo)準(zhǔn)和高級(jí)兩檔里各出現(xiàn)一次,功能矩陣還沒(méi)填滿,邊賣(mài)邊建的痕跡相當(dāng)明顯。
4 · 榜單數(shù)字之外
快樂(lè)馬在"有音頻"兩張榜上與Seedance 2.0的差距收窄到1-2分,基本平手。這說(shuō)明它的領(lǐng)先集中在純視覺(jué)質(zhì)量維度,而非全面碾壓。真實(shí)內(nèi)容生產(chǎn)場(chǎng)景下,音效、對(duì)白和環(huán)境音的同步質(zhì)量往往比畫(huà)面本身更決定完播率,這正是快樂(lè)馬還需繼續(xù)證明的地方。
此外,從ATH事業(yè)群4月16日上線"Happy Oyster"開(kāi)放式世界模型來(lái)看,快樂(lè)馬只是阿里這條布局序列里的第一張牌,后續(xù)產(chǎn)品還在路上。這是快樂(lè)馬的底氣所在,但同時(shí)也意味著現(xiàn)階段這匹馬承載的,更多是戰(zhàn)略意義上的破局,而非一個(gè)已經(jīng)打磨成熟的商業(yè)產(chǎn)品。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.