![]()
前陣子 AI 視頻圈最熱鬧的事,可能就是競技場那匹黑馬 HappyHorse。它沒有正式發布,沒有完整介紹,甚至連背后的公司是誰都不清楚。
更有意思的是,產品還沒真正開放,市場已經先替它完成了一輪商業驗證。大量仿冒套殼擦邊版 “ HappyHorse ” 一夜之間涌現,名字、界面、話術都在蹭這匹神秘黑馬。某種程度上,HappyHorse 已經變成了一個流量符號。
直到最近,這場猜馬游戲終于有了答案。阿里 ATH 團隊正式認領這匹競技場黑馬,并同時開放了 HappyHorse-1.0 灰測。
官網地址 www.happyhorse.cn
![]()
而在知危編輯部第一時間上手 HappyHorse-1.0 后,我們發現它真正值得關注的地方,可能不只是效果好,而是它正在用高質感和低成本,重新定義 AI 視頻生成的商業門檻。
這次 HappyHorse 主要開放了兩項功能:視頻生成和視頻編輯。
我們先試了最核心的視頻生成。實際跑下來,它的等待時間大概在 3 到 5 分鐘,單次最長能生成 15 秒視頻,畫質可以選 720P 或 1080P,參考圖最多支持 9 張。
在實際測試里,沒有參考圖的情況下,我們只用了一段不到 100 字的提示詞,就生成了一支質感不錯的紀錄片風格片段。
視頻整體音畫同步完成度相當高。比如手掌揉過面團時細碎的摩擦聲,面板隨著揉面節奏撞擊案臺的聲音,都能跟手部動作對上節拍。
![]()
而在加入參考圖之后,抽卡出片明顯更穩定了。我們用一張參考圖,一句簡短提示詞生成了一支 15s 漢堡廣告片,最終畫面不管是運鏡、配樂還是鏡頭氛圍,都比較接近成熟商業廣告短片。
![]()
我們還嘗試了經典電影橋段的復刻。在參考圖基礎上,需要提示詞里把環境、運鏡、臺詞、音效、節奏等等細節描述得更準確。
結果同樣不錯,前后一致性強,人物表演比較有情緒張力。
![]()
尤其是鏡頭指令遵循,什么時候切鏡、怎么切、在哪個時間點推進敘事,模型基本都能按提示詞執行。
比如我們在下面的視頻提示詞中描述,5-10s,鏡頭要拉開到稍遠的遠景,俯拍人物:
![]()
多輪測試后,我們也摸索出了 HappyHorse-1.0 目前比較清晰的使用方法。
如果只是隨手生成,它已經能給出不錯的質感;但如果想提高抽卡成功率,最好還是先用 GPT-Image-2 做出參考圖,再配合結構化提示詞,把各種畫面細節寫清楚。提示詞越具體,模型給出的結果越接近商業可用。
當然,它也不是沒有短板。目前,HappyHorse 在臺詞的情感層次,以及武打動作等復雜物理調度上,還有明顯提升空間。
而在視頻編輯方面,HappyHorse 可以直接通過文字指令修改畫面,也可以疊加參考圖,對局部元素進行二次調整。這一部分里,它同樣展現出了較強的指令遵循能力。
比如局部改動,我們提供了一張粉色口罩的參考圖,讓它給視頻中的人物戴上。實際效果里,口罩和面部貼合非常自然。
![]()
在大場景變化下,主體一致性也依然保持得不錯。比如下面這個案例,我們把暴雨場景改成雨過天晴,光線發生了變化,但人物外貌和動作沒有漂移。
![]()
整體測試下來,HappyHorse-1.0 的視頻生成效果,已經算是目前視頻模型里比較優秀的一個。
除了效果,他的價格優勢也是值得一提的。
視頻模型行業現在在商業化落地方面過得并不是特別好,即使它們畫面精致,目前落地也依然有很多阻礙。
因為商業內容生產,本質上不是偶然抽出一個驚艷樣片,而是持續、批量、可控地生產素材。這也決定了視頻模型想打開商業化的市場,至少要過兩道門檻:成本和可控性。
先看成本,可以說,AI 視頻生成天然就是一個成本敏感型工具。分辨率提高、時長加長、重試次數變多,價格可能呈指數級增長。對專業影視團隊來說,貴一點也許還能接受,但對普通創作者、MCN、小商家來說,一條視頻多花幾塊錢,放到幾十幾百條素材里,就是實打實的預算壓力。
而我們實際體驗下來,HappyHorse 還是比較有性價比的。目前在 HappyHorse 官網生成 720P 的 5 秒視頻,只要 2.2 元( 0.44 元/秒 ),這是最常見的包月價格第 2 檔,也就是專業用戶最常選擇的套餐,跟其他視頻平臺相比打了 62 折。企業級客戶通過阿里云調用 API 接口沒有門檻限制,不需要一次性預繳千萬級費用。
![]()
這個差距單看一秒并不夸張,但如果放到批量內容生產里,比如制作一部單集 5 分半、共 60 集的短劇,就能省下一萬元以上。
再看可控性。現實世界里的商業內容,并不只是要一段利于傳播的奇觀視頻,更多時候,創作者需要一段能直接被剪進成片、服務敘事、和前后鏡頭接上的素材。
這意味著,模型能否準確理解提示詞,再把各種視頻細節盡可能轉化為可控的變量,是影響 AI 視頻模型商業落地的關鍵。
![]()
從測試結果看,HappyHorse 在這一點上的優勢,主要集中在中近景內容。它在大光圈、淺景深、強氛圍感的鏡頭表達上完成度較高,指令遵循能力較強。
而這恰好對應了廣告、電商、短劇等社媒素材里的高頻需求。這類內容通常不需要復雜的大場面調度,卻非常依賴商品質感、人物情緒和鏡頭節奏的穩定性。
如果說去年的 AI 視頻賽道,還在執著于比拼生成更震撼的奇觀鏡頭,那么今年,這場競爭已經全面邁入更務實的商業落地階段。
AI 視頻模型能力的提升,正在重塑廣告、電商、短劇等內容的生產方式。
更重要的是,從今年我們看得出,HappyHorse 等國產 AI 視頻模型,徹底扭轉了國產模型跟在海外模型后面補課的局面,變成了行業的帶頭者。過去是別人發布一個新模型,國內團隊追著補齊短板;現在,新的變量和新的想象力,正在從中國模型開始。
從做 AI 視頻找樂子,到進入真實的內容生產鏈條,國產 AI 視頻模型的商業拐點,正在到來。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.