![]()
前兩天下午,在國家會議中心,主持了百度Create大會的數字人專場。
現場問了嘉賓一個問題:說起AI和數字人,很容易要么神話、要么矮化,怎么客觀看待?
嘉賓探客互動的蘇真,給我的回答印象很深:心態是要平視的,工具是組合起來用的。
我自己用數字人的體驗也是,打破了曾經的幻想之后,現在真正在業務里用起來,看到的是持續的驚喜。
![]()
01百度一鏡,和以往不一樣了
先說個背景。
百度這次把數字人品牌從慧播星升級為百度一鏡,數字人開啟了“全場景+全球化”時代。
![]()
很多人可能覺得,這就是個橫向的品牌延伸,但我先看到的,是AI技術和Agent的更深落地。
在后臺跟百度的同學聊了聊,發現這次升級背后,是整個產品邏輯的重新梳理。
慧播星時代,百度數字人的核心場景是直播。
就是幫你做個數字人主播,7x24小時在直播間里賣貨。
這個事他們做了三年,從最初幫一個茶農開播,到去年推出高說服力數字人,再到今年可以生成8到10分鐘的直播底板視頻,一步一步把直播這個場景打透了。
但問題是,直播只是數字人能力的一個應用方向,概括不了接下來更廣泛的應用趨勢。
所以百度一鏡這個新品牌,把能力邊界重新劃清楚了:數字人直播、數字人視頻、實時互動數字人,三大板塊。
能看出來,百度不再把數字人看作一個單一場景的工具,而是一個可以嵌入各種內容生產流程的基礎能力。
我在現場看到的一個案例印象很深。
現場展示了一個叫小七的教育博主,全網200多萬粉絲,他復刻了一個自己的數字人分身。
這個小七的數字人可以隨時在線回答用戶問題,還能實時追問,互動率上去之后,直播間轉化率提升了19%。
小七自己呢?他把精力騰出來去準備課程內容了。
這個邏輯其實挺樸素的。數字人不是在替代人,是在替代那些重復性的、標準化的、不需要創造力的工作。
人去做人擅長的事,機器去做機器擅長的事。
02一個視頻智能體,等于一個創作團隊
這次發布的重頭戲是海外版的上線,以及L3級別的視頻智能體。
先說L3是什么概念。
百度集團副總裁、百度電商、百度數字人總經理平曉黎,在現場把AGI分成了五個階段:
L1是聊天機器人,大家已經很熟了,ChatGPT那種。
L2是推理者,能解決人類級別的邏輯推理和解題。
L3是智能體,能夠自主思考并且代表用戶去執行特定任務。
百度一鏡的視頻智能體,就是L3級別的產品。
![]()
它的結構是這樣的:劇本Agent、視頻Agent、剪輯Agent,三個智能體協同工作。
劇本Agent相當于專業編劇,能理解創意需求,設計劇情和臺詞。視頻Agent相當于導演,懂視聽語言,做分鏡設計,生成首幀和生產視頻片段。剪輯Agent相當于后期團隊,負責剪輯、特效、成片交付。
這個配置,放在過去,是一個專業廣告制作團隊的全部職能。
我看了他們展示的可口可樂廣告案例。客戶的需求是在賽事期間做一個預熱TVC,要有分享快樂的基調,要有本土認同,要融入賽事元素。
百度一鏡拿到需求后,先做品牌信息掃描和目標用戶分析,提煉出足球讓老朋友重聚、可口可樂帶來歡樂時刻這個創意主題,然后調動三個Agent協同完成制作。
成片的水準,說是一線品牌廣告片毫不夸張。而過去這種級別的片子,預算動輒幾十萬上百萬,現在通過AI工具就能實現。
但我覺得更有說服力的案例是帕梅拉的帶貨視頻。
那條視頻的黃金前三秒,用了第一人稱視角沖下樓梯、抓住帕梅拉在偷吃披薩的疑問開場,一下子就抓住了注意力。然后是商品展示環節,15秒的片段里有特寫、有轉場、有信息密度極高的賣點講解。
這個視頻是怎么做出來的?
百度一鏡提供了分鏡級別的修改能力。比如你覺得第5個分鏡不好,想增加動態跟隨的運鏡效果,直接用自然語言輸入指令,系統就會重新生成。操作門檻很低,但可控性很強。
對于那些做內容出海的人來說,還有一個功能非常實用——視頻翻譯。現場展示了一個案例,原始視頻翻譯成外語之后,口型、節奏、語調都匹配得非常好,完全像個母語者在說話。現在已經支持12種語言。
說實話,我以前對AI視頻生成的態度是比較悲觀的。看過太多那種雖然酷炫但毫無商業可用性的demo,算法炫技的成分遠大于實際價值。
但百度一鏡這個產品,從設計之初就是奔著商業落地去的,每個功能都能對應到具體的使用場景,每個能力都能解決一個真實存在的痛點。
03落地的時候,比技術更重要的是怎么用
圓桌環節是我最期待的部分。
因為前面平曉黎和吳晨霞講的是產品能力,但產品能不能真正用起來、用出效果,取決于用戶。
所以請了四位嘉賓,分別來自央媒、MCN機構、SaaS服務商和電商商家,從不同角度聊聊他們實際使用數字人的經驗。
![]()
先說中新網的李光偉主編。
中新網作為國家級媒體,現在已經在大量使用數字人做新聞播報。我問了一個很直接的問題:數字人會不會替代真人主播?
李主編的回答很實在。他說數字人承接的是標準化、流程化、重復性的工作,比如突發新聞的快速播報、兩會議案的大量文字報道轉化成視頻。
這些工作如果讓真人來做,要化妝、換衣服、預約演播室、拍攝、剪輯,效率很低。一旦主播臨時有事或者身體不舒服,還會斷更。
數字人把這些低效環節替代掉之后,真人主播反而被解放出來了。他們有更多精力去奔赴新聞現場、做深度解讀、打造個人IP,從一個流水線上的播報員升級成深度新聞的創作者。
我覺得這個邏輯同樣適用于很多行業。AI不是來搶飯碗的,是來把你從繁瑣的重復勞動中解放出來的。
然后是雨遇文化的張少帥總。
他們公司手握超過10萬個短視頻賬號,達人的總GMV超過20億。放在過去,這是個極其人員密集型的產業,10萬個賬號需要多少人來運營維護?
但他們用上了百度的數字人體系之后,內容分發可以達到幾百萬的體量。少帥總說了三個很落地的建議:
第一,搶占閑置流量。凌晨時段、真人主播休息的時段,用數字人去填補,低成本撿漏增量。
第二,不要無腦批量復制。要用爆款拆解和微創混剪的方式做差異化產出,避免同質化內容對賬號造成損傷。
第三,堅持真人加數字人的組合打法。真人做人設,數字人做產能,數據互通,相互賦能。
說實話,這三點建議聽起來簡單,但能做到的人不多。因為太多人要么覺得數字人是萬能的,開了直播就能躺著賺錢;要么試了一下發現效果不好就徹底否定。這兩種心態都有問題。
探客互動的蘇真總也提到了這個問題。
他說得特別直白:數字人不是來替代人的,是團隊能力的一種延伸。你要合理調整預期,不要指望搞個數字人直播就能突飛猛進。你要去研究,在你的業務環節里,哪些部分用數字人加AI能帶來效率或效益的提升。
蘇總還說了一個觀點我特別認同:要學會組合工具。不是說你用了百度的數字人,就什么都不需要了。
你可能還需要用其他大模型來解決文案問題、話術問題。找到自己的業務和AI工具組合的最佳方式,這個能力比單個工具本身更重要。
最后是秋思電商的趙大勇總。
他們是百度電商的標桿商家,年營業額超過20億。大勇總給了一個非常炸裂的數據:2025年他們的開播數量比往年增長了500%到600%,整體GMV在競爭激烈的電商環境下增長了400%多。
這個增長怎么來的?他拆解了幾個核心原因:主播招聘、培訓、管理的成本幾乎降到了零;直播時長從每天四五個小時變成了24小時全天候;經營狀態極度穩定,不受主播情緒和身體狀況影響。
但他也坦承,數字人直播間不是掛機就能出單的。一定要搭配精準的話術、店鋪活動、商品機制、直播間封面和標題。所有這些細節優化到位,才能把流量轉化成訂單。
大勇總的經驗說明一個道理:工具再好,也要會用。你給一個普通人一臺專業攝像機,他拍出來的可能還不如手機。數字人也是一樣,它是放大器,不是自動提款機。
04
回到這篇文章的標題。我在后臺看到的那條路徑,其實很簡單。
第一步,數字人解決了效率問題。不管是直播、視頻還是實時互動,成本大幅下降,產出大幅提升。
第二步,效率提升帶來了規模化的可能。過去做不了的事情,現在可以做了。過去成本太高的事情,現在可以常態化了。
第三步,規模化應用沉淀出方法論。知道怎么用效果好,怎么用效果不好,哪些場景適合,哪些場景不適合。
第四步,方法論反哺產品迭代。百度聽到了用戶的反饋,知道哪些能力要補強,哪些痛點要解決,產品越來越好用。
路徑走通了,臨界點就到了。
![]()
百度數字人創新業務部、電商商業業務部負責人吳晨霞,在現場說了一句話,百度一鏡海外版今天正式上線,面向全球招募合作伙伴。
![]()
這不是終點,是起點。
作為主持人,我站在臺上看著這一切,心里其實挺感慨的。
過去幾年我主持過無數場關于AI的論壇,聽過的宏大敘事、看過的炫酷demo、翻過的精美PPT,多得數不清。但真正能讓我感覺到事情正在起變化的時刻,并不多。
昨天下午算一個。
不是因為技術有多震撼,而是因為我看到了真實的用戶在真實地使用這個產品,并且拿到了真實的回報。那些數據不是編出來的,是跑出來的。那些案例不是擺拍出來的,是做出來的。
百度一鏡的Slogan叫看見你的想象力。我覺得這句話有兩層意思。一層是你有多大的想象力,它就能幫你實現多大的價值。另一層是,它本身就是一扇窗,讓你看見想象力變成現實的過程。
而我,恰好站在窗邊,看了整個過程。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.