網易首頁 > 網易號 > 正文申請入駐

不用遙控，全靠看和學！這只機器狗憑模仿動物跑出敏捷新高度

2026-04-30 17:28:55　來源: 機器人大講堂

安徽舉報

分享至

如果你只在展會Demo里見過四足機器人的能耐，大概印象還停留在“遙控走路、預設動作”的階段。真正把一只機器狗扔進完全陌生的障礙賽場，不讓人類插手，讓它自己看路、判斷什么時候該跑、什么時候該跳，這件事，產業界目前還極少有機器人能做到。

在底層研究層面，南京大學研究團隊則走了一條更偏“生物啟發”的路徑：不依賴專家操作數據，直接讓機器人從真實狗的運動捕捉數據里學習自然步態。近日，他們在《自然通訊》《Nature Communications》上發表了這項成果。

基于一套融合“運動本能”與“任務規劃”的整合控制器，一臺宇樹四足機器人Go2僅靠正前方一枚深度相機，就在六類障礙物隨機排列的敏捷賽場上跑出平均1.1米/秒的速度，跨欄時最高沖刺到3.2米/秒，全場自主通關成功率超過78%。

01.

不是步態切換本身有多難，而是“誰來決策”的問題

讓四足機器人在不同地形上切換步態，企業產品早已能夠做到。真正的難點在于：當場地變成完全陌生的隨機障礙組合，沒有人類遙控、沒有預設路線、連全局定位都沒有的時候，機器人能不能自主判斷“前面是跳桿，我得提速，然后在合適時機起跳”？

南京大學團隊給出的答案是兩套協同工作的神經網絡。底層叫基礎行為控制器（BBC），相當于機器人的“小腦”和“脊髓”，負責維持平衡并產生五種基本步態——行走、踱步、小跑、慢跑和跳躍。上層是任務特定控制器（TSC），相當于“大腦”，用深度相機感知環境，自主決定調用哪種步態、給多大的速度指令。

這種架構的靈感來自神經科學：動物運動時，腦干和脊髓負責基礎步態和姿勢反射，大腦皮層和基底神經節則負責整合感官信息、做出行為規劃。論文將這套生物學分工搬到了機器人身上。

02.

從狗的動捕數據里學運動直覺

BBC最獨特的地方在于，它的步態不是工程師手工調參設計出來的，而是從真實狗的運動捕捉數據中“搬”到機器人身上的。研究團隊從公開的狗運動數據中提取了五種步態的骨骼動畫，通過運動重定向技術映射到Go2機器人身上

為了從數據中分離出不同的行為模式，他們設計了一種半監督的生成對抗模仿學習算法，僅用不到5%的標注數據，就訓練出了一個可以通過切換隱變量輸入來改變步態的策略網絡。

一個額外的好處是，除了離散的“步態類型”隱變量，系統還學到了一個連續的“風格”隱變量。調整這個變量，可以在同一種步態下改變小腿關節的擺動幅度等細節，讓動作看起來更接近生物的自然感，而非機械的重復。

這套BBC對速度指令的跟蹤精度也相當可觀：平均線性速度跟蹤誤差僅0.04米/秒，這為上層TSC的精準調度提供了可靠基礎。

03.

純視覺驅動的自主決策

讓機器狗“看懂”障礙場的是TSC。它接收來自Intel RealSense D435i深度相機的畫面，深度值被裁剪在0.3到4米范圍內，以50Hz的頻率刷新，然后輸出當前應該使用的步態類型、目標線速度和角速度等指令。

訓練TSC采用了一種“特權學習”架構。先讓一個教師策略訪問所有“上帝視角”信息，如精確的地形高程圖、障礙物類型、與下一個導航點的相對偏航角等，輕松學會在隨機場地中高速通行。然后訓練一個學生策略，它只能看到深度圖像和自身關節狀態，被要求模仿教師的行為并預測那些被隱藏的環境信息。

為了讓視覺系統能扛住真實世界里的傳感器噪聲，團隊還在深度編碼器中引入了自監督對比學習目標BYOL，訓練時給圖像隨機加入白噪聲、背景噪聲、高斯模糊等擾動。消融實驗表明，去掉這個模塊，成功率直接大幅下降。

值得注意的是，由于TSC采用門控循環單元（GRU）編碼歷史深度信息，即使下一個障礙還未完整進入當前畫面，機器人也能提前預判并準備切換行為，這在實際測試中表現為連貫、流暢的障礙間過渡。

04.

十分鐘打通虛擬到現實

仿真器中訓練好的策略搬到真實機器人上，往往會因為物理參數不匹配而出問題。傳統做法是手動調參或大范圍隨機化，效率低且難以精調。

團隊采用了一種叫進化對抗仿真器辨識（EASI）的方法來解決這個問題。簡單說，在真實世界和仿真器中各采集一小段運動數據（只需80秒），然后用一個神經網絡判別器猜測每組數據來自哪個世界，同時讓進化策略算法自動調整仿真器的物理參數，變得越來越以假亂真。

整個過程在GPU并行加速下不到10分鐘就能完成。

仿真器參數校準后，BBC在增強仿真器中微調約4000步（約兩小時），即可直接部署到真實機器人上，幾乎沒有性能損失。聯合頻譜和軌跡對比顯示，優化后的仿真器與真實世界的動力學特性高度吻合。

05.

看得見的敏捷

最終的系統在多項測試中交出了扎實的成績單。

在六類障礙物（A字板、跳桿、繞桿、蹺蹺板、輪胎跳、隧道）隨機排列的7×10米場地上，500次隨機測試中機器人跑出平均1.1米/秒的速度，平均完成時間24秒，成功率超過78%。

對比實驗中，傳統MPC控制器和缺少自然步態的基線方法無法順利通過跳桿等障礙；人類操作員手動遙控BBC，也因反應跟不上實時變化而難以完賽。

在跨欄專項測試中，四個跳桿隨機間隔2.5至3.5米放置，全程約15米。機器人自主從慢跑過渡到跳躍姿態，最高速度達到3.2米/秒，跳躍時身體高度可達0.54米。接觸序列記錄顯示，起跳時機和空中姿態都呈現出接近生物的運動特征。

各種單障礙測試中，本文方法對各類障礙幾乎達到100%成功率，且速度優于對照組。

06.

未來與結語

這項工作的核心貢獻不在于證明四足機器人能跑步，這件事產業界已經做到了。它的價值在于驗證了一條技術路徑：用模仿學習從動物數據中提取可端到端切換的自然步態庫，配合純視覺的自主環境理解，在隨機障礙場景中實現完整的感知-決策-運動閉環。

當然，這套系統也有明確的局限。任務特定控制器對障礙物幾何形狀的泛化能力有限，當障礙明顯超出訓練分布，比如更換了尺寸不同的障礙物，成功率會下降。

論文在補充材料中也展示了，對于遠超機器人跳躍能力的高箱，純粹的跳躍策略不再夠用，需要額外的“編輯策略”學習攀爬行為。

但無論如何，這項研究向動物級敏捷這個長期目標邁出了堅實一步。當機器人的步態不再來自工程手冊，而是來自對自然運動的模仿，它們的動作就會更流暢、更高效，也更接近我們期待中那種自然而然的靈動。

論文鏈接：https://www.nature.com/articles/s41467-026-72475-9

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

索尼研發乒乓球機器人打敗日本頂尖選手

每日經濟新聞 2026-04-23 17:49:24
1508 跟貼 1508
宇樹科技王興興：給機器人行業多一點耐心

財聯社 2026-02-18 18:01:39
31 跟貼 31

征服馬斯克！宇樹機甲強勢出圈，網友直呼太爭氣

雷科技 2026-05-13 21:01:53
6 跟貼 6

7×24小時直播記錄！Figure機器人化身打工人約30小時處理45000個包裹

財聯社 2026-05-15 13:20:09
0 跟貼 0
亦莊機器人馬拉松現場名場面合集

量子位 2026-04-20 00:34:54
0 跟貼 0

人形機器人半馬跑姿大賞，有的比人快多了！有的“狀況百出”

每日經濟新聞 2026-04-20 00:25:36
0 跟貼 0

剛剛開源了！

機器之心Pro 2026-03-25 15:18:26
0 跟貼 0
萬幀照片級仿真2

機器之心Pro 2026-05-07 17:57:19
0 跟貼 0

390萬元起，宇樹發布載人變形機甲

財聯社 2026-05-13 07:12:36
0 跟貼 0
朱旻琦：具身智能用一天進化一天、聰明一天機器人普及核心痛點是需要二次開發和適配

財聯社 2026-04-17 16:59:02
0 跟貼 0
LLM數據量大管飽，機器人數據卻連1%的起跑線都沒夠到？

量子位 2026-04-13 20:54:19
0 跟貼 0
新穎鰭足機器人，水陸兩棲行動自如，適應各種地形

裝甲鏟史官 2025-12-25 10:58:04
0 跟貼 0
機器人半馬成績，超越人類紀錄

財聯社 2026-04-20 00:27:12
0 跟貼 0
零樣本 Sim-to-Real ！2

機器之心Pro 2026-03-25 11:40:23
0 跟貼 0
機器人打包運輸的正確方式

裝甲鏟史官 2026-02-22 10:41:15
0 跟貼 0
荒野求生（機器狗全自主版），2025ATEC挑戰真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0
安心養蝦！從OpenClaw 看云上AI安全落地路徑

量子位 2026-04-18 19:55:39
0 跟貼 0
Agent輸出到底該用誰？卡帕西轉發：試試讓AI輸出HTML

量子位 2026-05-13 07:19:50
0 跟貼 0
AI第一次科研競賽中擊敗人類！Opus 4.7狂飆2930步創世界紀錄

新智元 2026-05-15 16:20:53
0 跟貼 0
AI Agent是科技革命中的一次真正的范式轉移

量子位 2026-04-03 22:52:35
0 跟貼 0
讓你的龍蝦秒變電影《Her》里的Samantha

量子位 2026-03-23 20:37:07
0 跟貼 0
MIT研究生用NotebookLM兩天學完一學期課程

量子位 2026-03-22 10:50:49
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
對談樓天城：Harness會成為AI時代最關鍵的能力之一

量子位 2026-05-06 15:41:08
0 跟貼 0
大神程序員蒸餾自己，用16個skill給AI注入軟件工程之魂

量子位 2026-05-12 03:08:58
0 跟貼 0
如何點亮小龍蝦的牛馬技能包?

量子位 2026-03-18 12:51:26
0 跟貼 0
百度沈抖自曝：老忘吃藥，用AI做了個小程序

量子位 2026-03-27 11:25:23
0 跟貼 0
Anthropic的AI讀心術，讓人類讀懂大模型在想啥

量子位 2026-05-10 23:00:57
0 跟貼 0
這個時代必須以Agent為中心：三個趨勢回顧

量子位 2026-04-05 02:14:15
0 跟貼 0
大模型的魅力在于突發涌現的能力

量子位 2025-12-11 03:38:02
0 跟貼 0
博士生如何用龍蝦做知識管理？歡迎圍觀！

量子位 2026-03-26 23:23:30
0 跟貼 0
吳恩達炮轟「AI就業末日論」：販賣失業焦慮，其實就是一門生意

機器之心Pro 2026-05-15 18:05:31
0 跟貼 0
陶哲軒：AI不能全用，深度思考不行

量子位 2026-03-19 01:35:49
0 跟貼 0
港科大（廣州）開源首個無需訓練的開放詞匯3D占據地圖構建系統

機器之心Pro 2026-05-15 12:50:10
0 跟貼 0
從智能體到賽博員工，生產力智能涌現

機器之心Pro 2026-05-15 18:02:32
0 跟貼 0
OpenAI Codex進入手機，國產“龍蝦”們該醒醒了

鈦媒體APP 2026-05-15 17:36:17
0 跟貼 0
原來這個動作是這樣做到的，腳是固定的！網友：還是很有感覺那種意境

重慶焦點 2026-05-13 17:22:46
13 跟貼 13
探毒+標記效率拉滿！機器狗協同默契有多高？

中國軍視網 2026-05-13 19:05:58
0 跟貼 0
現實里宇樹終于搞出了真·機甲？

手談姬 2026-05-15 17:29:33
0 跟貼 0
【崔哥天天侃5/13】美議員在中國工廠看不到人了，都是機器人在忙

北美崔哥 2026-05-13 21:16:03
19 跟貼 19

機器人大講堂

立德機器人平臺，是一個集媒體品牌、智庫咨詢、投資孵化、引智招商為一體的機器人垂直領域服務平臺

6563文章數 4585關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戲

教育

家居

藝術

軍事航空

手機 / 數碼

房產 / 家居

不用遙控，全靠看和學！這只機器狗憑模仿動物跑出敏捷新高度

兩年聯姻一地雞毛，傳蘋果OpenAI瀕臨決裂

媒體：中美元首會晤"刷屏" 特朗普用3個詞談中美關系

媒體：中美元首會晤"刷屏" 特朗普用3個詞談中美關系

德約科維奇買的球隊，從第6級聯賽升入法甲

方媛為何要來《桃花塢6》沒苦硬吃？

騰訊掉隊，馬化騰戳破真相

高爾夫GTI刷新紐北紀錄 ID. Polo GTI迎全球首秀

態度原創

喪尸生存FPS游戲《毒液突擊隊》將迎來重磅更新

榜樣！從晴川新銳到第1名上岸華科大，她用奮斗書寫滾燙青春！

110㎡淡而有致的生活表達

敦煌挖出王羲之書法！全卷2000字清晰如新！

烏克蘭首都基輔遭空襲 死亡人數增至12人

烏克蘭首都基輔遭空襲死亡人數增至12人