<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      哥大博士讓機器人臉告別“面癱”,看視頻學會11門語言

      0
      分享至

      你是否想過,當人類面對面交流時,我們的注意力更多地被放在哪里?

      第一直覺或許是眼睛。它們是心靈的窗戶,能夠傳達出細微而生動的情感。科學研究也證實的確如此,在日常對話中,我們會頻繁地注視對方的眼睛來捕捉情緒信號。

      不過,當環境變得嘈雜時,情況就有所不同了。研究表明,在噪音環境下,人們會將 50%-55% 的注意力轉向對話者的嘴唇,傾向于通過唇形來輔助理解對方在說什么。

      這也解釋了為什么即便是目前最先進的人形機器人,仍然讓人在和它們面對面交流時感到不適。我們可以容忍它們笨拙的步態,甚至僵硬的手勢,但當一張接近人類的面孔無法自然地活動時,就會生發出一絲詭異感。這就是機器人領域著名的"恐怖谷效應"——越接近人類卻又不夠完美的機器,反而會引發更強烈的排斥感。

      在致力機器人如何跨越“恐怖谷”效應的道路上,首形科技是積極的拓路者之一。這家由哥倫比亞大學博士胡宇航創立的初創公司,自成立起便選擇了一條與眾不同的技術路徑:不追求機器人在運動或操作能力上的極致性能,而是聚焦于賦予它們具有情緒表達能力的面部。過去一年多,這一方向為他們贏得了多輪融資,并且收獲了社交媒體和市場的廣泛關注。


      圖 | 胡宇航與人臉機器人 Emo (來源:受訪者)

      1 月 15 日,Science Robotics 封面刊發了胡宇航團隊關于 Emo 面部機器人的研究,展示了其如何通過學習實現與語音、歌曲同步的唇部運動,這也是 Science Robotics 首次將人臉機器人刊登在封面。這項工作源于他在哥倫比亞大學的博士研究,也是他近兩年在 Science 和 Nature 子刊上發表的第三篇論文。


      (來源:Science Robotics)

      嘴唇運動被低估的復雜性

      “嘴唇是人們交互過程中動作最多的部位, 也是機器人從表情自然到交互自然非常重要的門檻。”胡宇航告訴 DeepTech,嘴唇運動的復雜性遠超多數人的想象,甚至超出了機器人研究者此前的認知。

      從技術角度看,這種復雜性首先體現在驅動機制上。與眉毛等單一方向運動的面部特征不同,嘴唇由多個肌肉群驅動,運動過程中存在頻繁的接觸與分離。同時,嘴唇對時間精度極為敏感,還需同步承載語言、情感與社交信號。胡宇航指出:“這使得嘴唇運動的建模從根本上超越了參數化控制,成為一個高維、非線性、強閉環的生成式形變問題。”


      (來源:論文)

      既然如此,面對如此復雜的任務,如何客觀衡量機器人嘴唇運動的“真實性”呢?

      胡宇航團隊在論文中提出了一種創新方法:使用合成參考視頻作為理想同步基準,在 VAE 編碼器的潛空間中計算機器人嘴唇運動與參考視頻之間的距離。該指標能夠刻畫整體嘴型動態與時序結構的偏差,避免了依賴易受噪聲干擾的二維關鍵點。由此,研究者獲得了一個客觀的度量標準,可以在連續語音與多語言場景下評估音頻-視覺同步誤差。

      這可以說是創新的一步。因為此前,機器人領域對嘴唇同步的嘗試主要依賴手工預定義的運動規則和固定的音素-視位映射表。簡單來說,就是為每個音素設計一套固定嘴型,再讓機器人機械執行。

      但這種方法存在明顯的局限。胡宇航列舉了幾個關鍵問題:首先,同一音素的發聲速度會因說話人、場景或情緒而異。例如,一個人在激動和平靜狀態下說出的“好”,雖然音素相同,但嘴唇運動的幅度、速度和形態可能截然不同。其次,在多語言、歌唱或方言等場景中,基于音素設計規則需要投入巨大的手工工作量。更關鍵的是,當機器人硬件升級時,所有動作幾乎都要重新編排,難以復用。

      此外,這種規則方法還隱含了一個假設:音素與嘴型之間存在著穩定、一對一的映射關系。但這顯然與真實人類發音機制并不相符。實際上,同一音素的嘴唇運動在不同說話人、語速、情緒和語境下都存在顯著差異,其時序、幅度和形態高度連續且上下文相關。

      將這種連續性強行離散化為固定規則,必然丟失大量信息。規則方法也無法建模嘴唇作為軟體器官所具有的非線性、并行驅動和跨時間依賴特性,最終只能生成“正確但僵硬”的嘴型序列。

      相比之下,數據驅動方法能夠從真實人類與機器人發音數據中學習復雜的統計規律與隱含約束。胡宇航表示:“這從根本上突破了規則方法在泛化性、可擴展性和自然性上的瓶頸。”

      想要更像人,機器人需要“照鏡子”

      為了讓機器人更精準地復刻學習人類的嘴唇動作,胡宇航團隊巧妙地設計了兩階段“自監督學習系統”(Self-Supervised Learning, SSL):第一階段,機器人通過“照鏡子”建立自我模型;第二階段,它觀看人類視頻學習嘴唇運動規律。


      圖 | 用于機器人唇部同步的自監督學習框架(來源:論文)

      “兩階段設計的核心原因在于機器人與人類在外觀、結構和運動約束上的本質差異。”胡宇航解釋道。若跳過第一階段,直接讓機器人模仿人類視頻,將不可避免地學習到大量自身硬件無法執行的形變模式,例如人類皮膚的滑移、唇齒細節或肌肉驅動方式。這些錯誤映射最終會導致機器人動作失真、抖動或被系統性削弱。

      第一階段的“照鏡子”訓練,目的并非學習表情本身,而是讓模型明確“哪些運動在自身硬件與軟體結構下是可實現的”。通過隨機生成數千個面部表情并觀察鏡中反饋,系統建立起從視覺變化到自身可控空間的映射關系,為后續學習提供物理可行性的約束。

      在具備自我模型的基礎上,第二階段引入人類視頻的作用變得清晰:機器人學習人類嘴唇運動的統計規律與高層時序結構,并通過自我模型將這些規律投射到自身可執行的動作空間中。“這本質上是先解決‘我是誰、我能怎么動’,再解決‘人類是如何動的’。”胡宇航說。該策略有效避免了跨形態直接模仿帶來的域錯配問題,是實現自然、穩定且可泛化嘴唇運動的關鍵前提。


      圖 | 團隊機器人 Emo 照鏡子(來源:胡宇航)

      出色的跨語言泛化能力

      實驗結果展示了這套系統的出色泛化能力:它能在 11 種語言中實現自然的嘴唇同步,包括英語、法語、日語、韓語、西班牙語、意大利語、德語、俄語、中文、希伯來語和阿拉伯語。


      圖 | 多語言口型同步性能的測試結果(來源:論文)

      這種神奇的"跨語言"能力從何而來?胡宇航解釋道:“系統并未學習語言或音素本身,而是學習了人類發音過程中更底層的肌肉運動模式。”在兩階段自監督框架下,模型首先熟悉機器人自身嘴唇能做出哪些動作;隨后在觀看人類視頻時,它不再關注具體是哪種語言、哪個發音,而是去捕捉聲音節奏與嘴唇動作之間那些跨越語言邊界的共性規律。

      “這些關系在不同語言中表現為高度一致的運動模式,比如張合節律、閉合-釋放結構、過渡速度等。”換句話說,雖然各種語言的發音規則千差萬別,但人類嘴唇的運動方式終究受限于相同的生理結構。正因如此,系統學到的是聲音與動作之間更本質的對應關系,使它能夠自然地適應多種語言,甚至應對不同的語速和說話風格。

      盡管成果顯著,胡宇航坦言系統仍面臨技術挑戰,其中最典型的是硬輔音(如 /b/、/p/、/m/、/w/)的處理。這些音素之所以棘手,不僅因為發音速度快,更因為它們同時涉及多重難以精確建模的約束條件。

      以 /b/、/p/、/m/ 為例,發這幾個音時,嘴唇需要在極短時間內完成“閉合—保持—釋放”這一連串動作。閉合不夠緊或時機稍有偏差,人耳立刻就能察覺異樣。而 /w/ 更為復雜,不僅要求雙唇閉攏,還需要嘴唇前突、形成圓形,同時配合口腔形狀的連續變化。胡宇航補充,這意味著模型必須在毫秒級時間精度下,協調多個高度耦合的自由度,同時應對軟體接觸、非線性阻尼以及電機帶寬限制等物理因素。

      與元音或軟輔音那種平滑漸變的動作不同,硬輔音更像是一種"開關式"的動作——既有連續的運動軌跡,又有瞬間的接觸切換。這恰恰是當前數據驅動模型最容易出錯、機器人執行難度最高的地方。

      從實驗結果來看,當前方法在一些極端語音場景下表現欠佳,比如語速極快、多人同時說話、歌唱中的顫音,以及情緒激動時的表達。胡宇航認為,這反映了方法的本質邊界:"模型主要學習的是典型對話語境下聲學時序與嘴唇運動之間的關系。"一旦輸入偏離日常對話的范疇,系統性能便會下降。

      不過他也指出,這些失效案例恰恰為未來研究指明了方向:“這也為我們引入更豐富的對話與語音場景提供了思路。”隨著訓練數據的豐富和模型能力的提升,這些邊界場景的處理能力有望逐步改善。

      在采訪最后,DeepTech 問及這項技術是否會從唇部動作擴展到整個面部表情系統。

      “會的。”胡宇航給出肯定回答,“我們團隊的最終目標,是實現完整的類人交互。”如何協調唇部動作與眼神、眉毛等其他面部要素,形成統一而細膩的情感表達,正是團隊下一步要攻克的方向。這不僅是技術上的自然延伸,更是對人機交互本質的深度探索。當機器人能夠用整張臉來表達和理解情緒時,它與人類的關系將發生更深刻的轉變。

      論文地址:DOI: 10.1126/scirobotics.adx3017

      營/排版:何晨龍

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      SK海力士總部人均獎金610萬引不滿 部分員工要求漲薪

      SK海力士總部人均獎金610萬引不滿 部分員工要求漲薪

      CNMO科技
      2026-05-08 07:46:08
      秋千墜亡女子身后排隊游客發聲:該女子同行朋友開玩笑稱“沒綁緊”嚇唬她,事發后其朋友一直哭泣,深感愧疚

      秋千墜亡女子身后排隊游客發聲:該女子同行朋友開玩笑稱“沒綁緊”嚇唬她,事發后其朋友一直哭泣,深感愧疚

      洪觀新聞
      2026-05-07 14:44:22
      特朗普舉著孩子照片,對哭泣的母親承諾:我相信中國會執行死刑的

      特朗普舉著孩子照片,對哭泣的母親承諾:我相信中國會執行死刑的

      博覽歷史
      2025-07-21 17:59:30
      “晚打不如早打,小打不如大打,打一個,不如拉日本一起打”。

      “晚打不如早打,小打不如大打,打一個,不如拉日本一起打”。

      安安說
      2026-03-14 18:50:59
      5月8日世乒賽最新消息:王楚欽發文 林詩棟迎挑戰 直播有變

      5月8日世乒賽最新消息:王楚欽發文 林詩棟迎挑戰 直播有變

      軒逸阿II
      2026-05-08 18:21:00
      游戲中的中國背景永遠都是臟亂差,“不隨地吐痰”顯得格外刺眼

      游戲中的中國背景永遠都是臟亂差,“不隨地吐痰”顯得格外刺眼

      街機時代
      2026-05-06 15:00:03
      不想訪華了?美國聯合27國,準備廢除中國王牌,中國自爆家底

      不想訪華了?美國聯合27國,準備廢除中國王牌,中國自爆家底

      人間無味啊
      2026-05-07 10:31:04
      傷得很深!男子打賞女主播近300萬,想結婚時才知對方女兒都20歲了:我只顧為愛沖鋒,結果她全是假話

      傷得很深!男子打賞女主播近300萬,想結婚時才知對方女兒都20歲了:我只顧為愛沖鋒,結果她全是假話

      臺州交通廣播
      2026-04-10 16:23:25
      為什么你的俯臥撐毫無增肌效果?90%的人都做錯了“手肘夾角”

      為什么你的俯臥撐毫無增肌效果?90%的人都做錯了“手肘夾角”

      解說阿洎
      2026-05-08 11:14:28
      410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

      410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

      深度報
      2025-12-14 22:36:54
      老師多次提醒:軍校是沒有回頭路的,如果因為軍隊待遇好而報考,建議別報!

      老師多次提醒:軍校是沒有回頭路的,如果因為軍隊待遇好而報考,建議別報!

      譚老師地理大課堂
      2026-04-24 00:05:13
      林志玲身材好是眾所周知,右邊這哥們看著眼熟,但身材也超好的吧

      林志玲身材好是眾所周知,右邊這哥們看著眼熟,但身材也超好的吧

      東方不敗然多多
      2026-05-08 18:38:50
      明星套現離場,留下85億窟窿,華誼兄弟被誰“抽”干了?

      明星套現離場,留下85億窟窿,華誼兄弟被誰“抽”干了?

      帥真商業
      2026-05-06 21:23:01
      爭議!鄭欽文委屈落淚:向裁判抗議安保人員亂走動 反遭對方回懟

      爭議!鄭欽文委屈落淚:向裁判抗議安保人員亂走動 反遭對方回懟

      風過鄉
      2026-05-07 19:49:48
      被罵“酸黃瓜”三個月后,閆學晶回東北老家,這次她真的大變樣

      被罵“酸黃瓜”三個月后,閆學晶回東北老家,這次她真的大變樣

      網絡易不易
      2026-05-08 12:55:15
      世界杯票價高?特朗普:要是這個價格,我也不會花錢買票

      世界杯票價高?特朗普:要是這個價格,我也不會花錢買票

      懂球帝
      2026-05-08 10:57:09
      喪葬畸形攀比!有網友哭訴邵陽老人過世6天花一百來萬,引發共鳴

      喪葬畸形攀比!有網友哭訴邵陽老人過世6天花一百來萬,引發共鳴

      火山詩話
      2026-05-07 08:54:39
      湖人107-125雷霆,賽后傳來2個好消息和3個壞消息 詹姆斯無力回天

      湖人107-125雷霆,賽后傳來2個好消息和3個壞消息 詹姆斯無力回天

      林子說事
      2026-05-08 14:42:14
      老人再婚后第一次圓房有何感想?67歲老人傾訴:她給了我很多驚喜

      老人再婚后第一次圓房有何感想?67歲老人傾訴:她給了我很多驚喜

      熱心柚子姐姐
      2026-05-07 16:28:09
      4只1035元天價皮皮蝦事件反轉?官方回復:未超調控價,游客:沒收到退款

      4只1035元天價皮皮蝦事件反轉?官方回復:未超調控價,游客:沒收到退款

      上觀新聞
      2026-05-07 20:24:15
      2026-05-08 19:08:49
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16676文章數 514933關注度
      往期回顧 全部

      科技要聞

      SK海力士平均獎金600萬 工服成相親神器

      頭條要聞

      伊朗成立新部門 所有想過霍爾木茲的船要先填40多道題

      頭條要聞

      伊朗成立新部門 所有想過霍爾木茲的船要先填40多道題

      體育要聞

      他把首勝讓給隊友,然后用一年時間還清賬單

      娛樂要聞

      古天樂被曝隱婚生子,新娘竟是她

      財經要聞

      輪到豆包收割了?

      汽車要聞

      智能雙艙大五座SUV 樂道L80將于5月15日正式上市

      態度原創

      教育
      數碼
      旅游
      本地
      家居

      教育要聞

      南京江寧區2026年小學、初中招生入學工作實施細則

      數碼要聞

      AI時代 CPU依然中流砥柱!AMD加冕數據中心之王

      旅游要聞

      水潤歷下|湖光山色間,他們“擦亮”一城碧水

      本地新聞

      用蘇繡的方式,打開江西婺源

      家居要聞

      流動的尺度 打破家的形式主義

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 婷婷色香| 精品日产卡一卡二卡麻豆| 无码专区3d动漫精品免费| 国产午夜精品福利视频| 久久精品国产一区二区蜜芽| 久久99国产亚洲高清观看首页| 91久久国产情侣真实对白| 尤物一区| 国产色无码专区在线观看| 丁香五月人妻| 日亚韩在线无码一区二区三区 | 日韩精品乱码AV一区二区| 亚洲日韩在线中文字幕| 午夜福利看片在线观看| 亚洲熟女精品一区二区| 成人精品视频一区二区| 亚洲高清色| 黄色日本视频| 国产人妖乱国产精品人妖| 又黄又无遮挡AAAAA毛片| 欧美精品久久天天躁| 偶偶福利影院| 国产二区三区不卡免费| 久久er国产精品免费观看2| 亚洲区少妇熟女专区| 精品久久久bbbb人妻| 另类一区| 粗大猛烈进出高潮视频| 嫩草av久久伊人妇女超级a| 欧美日韩国产综合视频在线观看 | 亚洲最大福利视频网| 97国产超碰一区二区三区| 无码人妻网站| 天天躁日日躁狠狠躁一级毛片| 人人91人人澡人人妻人人爽| 无码精品国产va在线观看dvd| 国产精品视频一区二区噜| 日韩A级毛片| 99精产国品一二三产品香蕉| 无码精品人妻| 国产精品无码久久综合|