一度登頂全球AI盲測榜單的阿里“歡樂馬”HappyHorse 1.0,終于揭開神秘面紗。
4月27日晚,阿里巴巴視頻生成模型 HappyHorse 1.0正式開啟灰度測試,這款曾以匿名身份橫掃國際權威AI視頻榜單、被行業熱議多日的“黑馬”,從幕后走到了臺前。
作為阿里ATH創新事業部打造的多模態生成模型,HappyHorse 1.0采用音視頻聯合生成方案,瞄準廣告、電商、短劇、社媒創意等場景,推出AI視頻生成與視頻編輯服務。
![]()
(圖源:截圖自HappyHorse官網)
當前AI視頻生成賽道中,運動流暢性、人物一致性、自動分鏡與自動運鏡,是決定內容可用度與專業質感的幾個核心指標。其中,運動流暢性關乎畫面自然度,人物一致性決定角色辨識度與敘事連貫度,自動分鏡與自動運鏡則體現模型的創意編排與鏡頭語言能力,直接影響成片的敘事節奏與視覺表現力。
為此,開機實驗室將從以上這幾個維度對HappyHorse 1.0展開實測。
目前,全球專業創作者與企業客戶可通過官網、阿里云百煉平臺注冊體驗,普通用戶則可通過千問App試用。
HappyHorse官網新用戶注冊即贈送66積分,可生成視頻比例囊括了16:9、4:3、3:4、1:1、9:16共5個常規視頻比例。一次可生成視頻時長在3-15秒之間,調節相對靈活。據開機實驗室實測,生成3秒視頻需要消耗19積分,5秒需消耗32個積分,10秒則需消耗63積分。
![]()
(圖源:截圖自HappyHorse官網)
千問APP提供的體驗額度則更大,用戶每日有10個額度的體驗額。只要在APP內找到HappyHorse內測接口,可選擇的視頻比例、清晰度與網頁版一致,但在時長選擇上相對固定,僅有5秒、10秒、15秒三個時長選項,生成5秒視頻消耗1個額度,10秒消耗2個額度。
![]()
(圖源:截圖自千問APP)
以下視頻均為使用千問APP生成,輸入指令后,排隊等待時長大約在2-3分鐘。
為了測試HappyHorse生成視頻的運動流暢性,開機實驗室分別輸入了人物在行走和演奏樂器兩段文字指令。
第一段指令為:
黃昏的城市街道,柏油路面殘留雨后水跡。一位身著米色風衣的女性在人群中穿過,手臂自然垂在身體兩側擺動,每一次跨步都是腳跟先落地,平穩向前行。身后街燈倒映在路面上光影斑駁。攝影機角度保持低位,近乎與地面齊平——仿佛一名蹲在路邊的行人正在隨意觀看。
從實際生成效果來看,模型完整還原了腳跟到腳掌的連貫落地步態,人物手臂擺動與行走節奏匹配協調,風衣隨肢體動作產生的布料褶皺真實自然,未出現腳底滑移、懸浮等常見 AI瑕疵,但細看街上的照片漢字出現了“生造字”情況。
第二段指令為:
中景鏡頭,一位身穿休閑襯衫的吉他手坐在木質高腳凳上,快速進行高把位和弦轉換與擊勾弦演奏。撥片在琴弦上細碎跳動著。運鏡自動跟隨按弦的手腕軌跡平移。
整體下來,畫面細節貼合演奏邏輯,手指形態自然無畸形、多指問題,撥片與琴弦交互也較為寫實,中景下的高把位演奏動作連貫,撥片細節、手腕跟隨運鏡均完整落地。
此外,強動態高速運動、瞬間撞擊反饋以及極速慢鏡頭演繹,也是檢驗 AI 視頻模型運動流暢度與物理還原能力的關鍵場景。
為此,開機實驗室輸入了以下指令:
傍晚的足球場,夕陽金色草地。前鋒全速帶球沖向禁區,右腳大力抽射,球鞋側面與皮球在撞擊瞬間產生形變。立即切換為超高速慢動作模式:鞋釘掀起的草皮碎屑緩緩飛揚;守門員飛身撲出時球衣隨風沙沙作響;足球在空中高速旋轉劃出弧線,最后撞擊球網將尼龍網格拉伸成長長的菱形。
在生成的10秒視頻里,文字指令里提到的夕陽、草地、抽射、慢鏡頭等元素基本都被還原出來,畫面氛圍感也在線。但仔細觀察就會發現,腳踢中足球泥土濺起那一刻畫面比較假。另外,動作之間的銜接存在不夠順滑的情況,運動員整體發力、碰撞、足球的飛行的邏輯不太符合現實物理規律,AI痕跡比較重。
一直以來,AI 視頻最讓人頭疼的問題之一就是人物的一致性,部分AI生成的視頻前后會出現“換臉”情況。前一秒還是這個五官,轉個頭就面目全非,發型、穿搭也會莫名其妙變化。所以,人物在生成的全程畫面里保持形象統一,也成為衡量一款AI視頻模型好不好用的指標之一。因此,開機實驗室通過文字指令不斷地切換場景,來測試模型能否在動態運動、鏡頭切換、長時間生成中,保持人物特征,不崩臉、不跳變、不“自我修改”。
第一段指令為:
連續片段展示一位戴黑框眼鏡、留三七分短發、穿櫻花粉毛衣的女性室內設計師。她先在落地窗大客廳受訪;接著轉入暖黃燈光與木質書架共存的書房伏案改圖;再進入正在裝修的毛坯房工地指導施工。短發始終朝左前額自然垂落,毛衣左胸處有同色系花紋帶,膚色在日光、暖光與粉塵光中自動匹配真實光影漂移。
從生成的視頻來看,人物在幾個場景轉換中都保持了一致,未出現異常(除了扶眼鏡時扶到了鏡片上)。為了進一步測試,在下一個文字指令中,又增加了更多的人物特征和鏡頭轉換。
第二段文字指令為:
視頻展示一位中年亞裔男性廚師在開放式廚房連續完成動作:正面面對攝像頭(近景)描述食材,向左后方轉身取鹽罐(過肩鏡頭),然后再次面向鏡頭進行翻勺演示(半身中景)。他左眉根部的痣在每次特寫時始終處于同一位置。
在該段視頻里,廚師轉身再轉回的過渡中并未出現“瞬間換人”感,特殊面部標識也一直都在。不過,左眉根部的痣有點像“粘”上去的。
如果是更極限的場景呢?在下面一個視頻里,開機實驗室設置了AB兩場景交叉敘事,指令如下:
A場景:身穿藏青色夾克、佩戴工牌的企業安全主管在監控室里查看屏幕,她看著面前一整面墻的安防監控畫面。隨后,同一安全主管立刻在應急指揮中心下達行動指令,她手持對講機,神情嚴肅。
B場景:劇情切換到應急響應小組(2-3名新配角,身著統一工作服)按指令迅速展開行動,分別跑向不同通道。
最后鏡頭切回安全主管的中景特寫。
視頻中,來回跨場景時,主管的面容始終保持穩定,發型、膚色沒有出現跳變與違和,全程也沒有出現配角喧賓奪主、角色面部錯亂替換的情況,整體表現相對穩定。不過,開機實驗室注意到一個小細節,視頻中主管的工牌上的照片似乎與其本人并不相符,工牌上的文字也多為亂碼,簡單說就是大的邏輯關系和畫面把握得比較好,但是細節的處理還不夠細膩。
另外,自動分鏡與自動運鏡屬于AI生成視頻模型中的高階動態調控能力,如果生成畫面能夠自主完成畫面視角切換與鏡頭跟隨,能大幅提升成片的鏡頭流暢度與氛圍感。
為此開機實驗室也設置了一組場景來檢查HappyHorse1.0該項能力。以下為指令:
一縷陽光穿過未完全拉開的亞麻窗簾,投射正在煮咖啡的年輕女性臉上。鏡頭慢慢推進展現她側臉。當她伸手時,自動切換至低角度跟隨她的手打開柜門,緊接著轉為過肩視角,透過她的肩膀看到客廳里小孩在地毯上玩樂高。當咖啡機傳來“叮”的一聲,畫面快切為一個微距大特寫——一滴深褐色濃縮咖啡滴入透明玻璃杯,激起小氣泡。
生成視頻能在一些敘事節點自主決策切換鏡頭,不同景別的選擇也相對合理,但存在部分鏡頭與劇情匹配度不高和畫面不夠流暢的地方。
再來一段具有懸疑氣質的連續敘事:
一位穿棕色皮夾克、扎馬尾的私家偵探在雨夜推開后巷廢棄汽車旁的一扇鐵門。全景是后巷環境、廢棄汽車、鐵門位置,偵探緩緩推門進入。中景跟進,偵探跨過門檻,抬手摘下墨鏡,露出警惕的眼神。快速切至室內低角度鏡頭,畫面中出現一個背對鏡頭的模糊人影(敵方),偵探停步,對峙感形成。
這段指令的難點在于,需精準把控“全景交代環境→中景跟拍動作→特寫傳遞情緒”的連貫鏡頭敘事邏輯,同時保證各鏡頭間的時間銜接、空間方位無任何違和與矛盾。測試下來,模型基本復刻了這一敘事節奏,更值得肯定的是,鏡頭運鏡的切換、角度的選擇,均與懸疑氛圍高度契合,精準烘托出緊張壓抑的對峙張力。
總體而言,HappyHorse 1.0在當前AI視頻生成模型中展現出較強的綜合競爭力,尤其在人物一致性和基礎運動還原上已達到較高水準,自動分鏡能力也初步具備了實用價值。但在極端物理場景的真實感、畫面微觀細節的精確度,以及分鏡節奏的穩定性上,仍存在可感知的不足。
好消息是,對于內容創作者而言,它已經是一個值得關注的生產力工具,但若要勝任高精度、強敘事的專業影視制作,還需要進一步迭代。
價格上,HappyHorse官網新用戶享一定免費額度(以贈送積分方式),720P、1080P視頻刊例價分別定為0.9元/秒、1.6元/秒,專業會員包月價格疊加限時折扣后為0.44元/秒和0.78元/秒,商用門檻進一步降低。
同為AI視頻生成模型,字節Seedance 2.0則是按Token計費,據火山引擎官網,Seedance2.0輸出分辨率為720P的情況下,包含視頻輸入的價格是28元/百萬tokens,不含視頻輸入的價格是46元/百萬tokens。
![]()
(圖源:截圖自火山引擎官網)
按照此前媒體測算,在Seedance 2.0生成15秒視頻,需要消耗30.888萬tokens,最終折合每秒1元。如果簡單對比,HappyHorse相比Seedance2.0在視頻生成價格上每秒大概有一毛錢優勢。不過費用最終還是會取決于視頻的復雜程度,畢竟兩者計費體系完全不同。
阿里更明確的意圖體現在生態卡位上。HappyHorse在移動端嵌入千問App,PC 端開放創作網頁版,形成面向普通用戶與創作者的雙入口。同時,阿里悟空、Mulerun、JVS Claw等Agent平臺率先完成接入,ZeroCut AI、巨日祿AI、LibTV-official等AI創作平臺也宣布已接入HappyHorse1.0.生態擴張速度加快。
HappyHorse 1.0的亮相,與其說是一場價格革命,不如說是阿里在AI視頻賽道的一次生態級入場——用模型能力敲門,用平臺生態占位。至于它能否真正攪動格局,答案或許在于,接下來有多少創作者愿意把它放進自己的工作流中。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.