網易首頁 > 網易號 > 正文申請入駐

日本團隊蛇形機器人解鎖滾動前進新姿勢，能效提升10倍

2026-04-27 20:55:37　來源: 機器人大講堂

安徽舉報

分享至

蛇形機器人的運動方式迎來了一次全新突破。

日本大阪公立大學的研究團隊讓蛇形機器人學會了一項新技能——滾動前進。這不是簡單的翻滾，而是讓機器人變形成輪胎狀，通過移動重心讓重力驅動滾動。

更關鍵的是，他們用深度強化學習（Deep Reinforcement Learning）訓練出的控制器，讓機器人滾出了幾乎直線軌跡。

實驗數據顯示，與傳統方法相比，新方法在多個指標上都實現了大幅提升：軌跡曲率半徑提升66倍（從0.89米提升到58.75米），旅行效率達到0.43，是傳統蜿蜒運動的2-10倍，速度達到0.207 m/s，約為另一種先進步態的2倍。

這項研究已發表在機器人領域權威期刊《Robotics and Autonomous Systems》上。

01.

為什么要讓蛇形機器人"滾"起來？

傳統蛇形機器人主要依靠蜿蜒爬行前進，這種運動方式看起來很酷，但存在一個重要問題：能耗太高。

為了產生S形波動，機器人需要同時驅動十幾個伺服電機，每個都要輸出大扭矩來對抗地面摩擦力。對于依靠電池供電的機器人來說，這簡直是超級能耗負擔。

研究團隊另辟蹊徑，提出了一種基于重心轉移（COG shift）的滾動運動方法。具體來說，機器人首尾相連形成環形結構，然后通過移動頭部或尾部關節來改變重心位置。當重心偏離支撐點后，重力產生的力矩就能驅動滾動。

這相當于讓重力來"打工"，大幅降低了能耗需求。在平坦地面上，這種滾動運動的能效是傳統蜿蜒運動的2-10倍。而且，這種平行雙輪形態比單環形狀提供了更好的穩定性。

不過，早期的設計存在一個關鍵問題。

團隊在2023年就提出了這個想法，并用試錯法和遺傳算法設計了控制器。但由于只依靠加速度計反饋滾動角度，無法保持直線行駛。當路面條件發生變化時，機器人容易偏離預定軌跡。

02.

強化學習讓機器人學會"走直線"

為了解決直線性問題，研究團隊引入了深度強化學習來設計控制器。

他們采用了Soft Actor-Critic (SAC)算法，這是一種離線策略的深度強化學習算法。通過在仿真環境中進行訓練，讓機器人學會如何利用陀螺儀和加速度計的反饋信息來維持直線運動。

關鍵創新在于引入了觀測緩沖區（observation buffer）機制。

由于伺服電機存在驅動角度范圍和角速度限制，而滾動運動是通過可動連桿變形和地面反作用力產生的，系統存在從動作變化到運動生成的時間延遲。這會嚴重影響強化學習的收斂性。

為此，團隊提出了帶有時間積分動作的觀測緩沖區結構，有效改善了在關節角速度約束下的學習收斂性。觀測值包括：

經過低通濾波的加速度和角速度
目標關節角度
歷史觀測值緩沖

訓練時還引入了設計的獎勵函數。除了基本的滾動速度獎勵，還加入了轉向懲罰項，用于鼓勵機器人保持直線前進：

當檢測到偏航角速度增大時，獎勵值會相應降低。這讓強化學習策略學會了利用陀螺儀反饋來修正行進方向。

實驗結果證明了這種方法的有效性。在不同的觀測緩沖區大小下，緩沖區越大，獎勵收斂速度越快，行駛速度也越高。當緩沖區大小為Nd=20、Nskip=2時，機器人達到了最佳性能。

03.

實驗驗證：能效和直線度雙雙大幅提升

研究團隊在真實環境中進行了大量實驗驗證。

在光滑地板上的測試中，強化學習設計的滾動運動實現了45.59米的曲率半徑，遠超試錯法的1.74米和優化算法的2.62米。即使在有防水罩的情況下，曲率半徑仍達到23.90米。

從運動軌跡對比可以看出，試錯法設計的運動會產生明顯的偏航，優化算法稍有改善但仍有曲線，而強化學習方法實現了近乎直線運動。

能效方面的提升同樣顯著。實驗測得：

滾動運動功耗僅27W，而傳統側向蜿蜒需要54.9W
行駛效率η達到0.43，是側向蜿蜒（0.24）的近2倍
速度達到0.207 m/s，與傳統方法相當但能耗降低一半

特別值得一提的是，強化學習方法不再嚴格區分踢腿階段、重心轉移階段和自由滾動階段，而是實現了連續平滑的運動控制。從關節角度變化曲線可以看出，運動模式呈現三角波形，這是由于伺服電機最大角速度約束自然形成的。

這種方法的另一個優勢是魯棒性強。即使實驗模型由于關節負載導致形狀偏離理想圓形，速度低于仿真結果，但基于IMU傳感器反饋的策略仍能在適當時機驅動關節，保證機器人持續前進。

當然，這種滾動運動也有局限性。在草地等復雜地形上無法實現滾動，此時仍需切換到傳統的蜿蜒運動模式。但在平坦地面上，滾動模式讓蛇形機器人的續航能力大幅提升，有效緩解了電池容量限制。

研究團隊表示，這種基于強化學習的控制框架考慮了關節角速度約束，對于采用高減速比伺服電機的四足機器人等系統也有潛在應用價值。未來他們將繼續研究如何在輕微起伏的地形上實現滾動運動，并探索通過切換運動模式來實現轉向控制。

這項研究展示了深度強化學習在機器人運動控制中的巨大潛力，為蛇形機器人在實際應用中的能效優化提供了新思路。

論文鏈接：

https://www.sciencedirect.com/science/article/pii/S0921889026000436?via%3Dihub

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

索尼研發乒乓球機器人打敗日本頂尖選手

每日經濟新聞 2026-04-23 17:49:24
1508 跟貼 1508
宇樹科技王興興：給機器人行業多一點耐心

財聯社 2026-02-18 18:01:39
31 跟貼 31

英偉達拿出推理版VLA：Alpamayo-R1讓自動駕駛AI更會動腦子

機器之心Pro 2025-12-02 14:07:01
0 跟貼 0

打破推理同質化！阿里達摩院新作讓RLVR從重復采樣走向有效探索

機器之心Pro 2026-05-14 13:44:05
0 跟貼 0
一級市場新共識：人形機器人賽道，先投零部件

經濟觀察報 2026-05-15 15:24:11
0 跟貼 0

亦莊機器人馬拉松現場名場面合集

量子位 2026-04-20 00:34:54
0 跟貼 0

人形機器人半馬跑姿大賞，有的比人快多了！有的“狀況百出”

每日經濟新聞 2026-04-20 00:25:36
0 跟貼 0
剛剛開源了！

機器之心Pro 2026-03-25 15:18:26
0 跟貼 0

萬幀照片級仿真2

機器之心Pro 2026-05-07 17:57:19
0 跟貼 0
390萬元起，宇樹發布載人變形機甲

財聯社 2026-05-13 07:12:36
0 跟貼 0
朱旻琦：具身智能用一天進化一天、聰明一天機器人普及核心痛點是需要二次開發和適配

財聯社 2026-04-17 16:59:02
0 跟貼 0
新穎鰭足機器人，水陸兩棲行動自如，適應各種地形

裝甲鏟史官 2025-12-25 10:58:04
0 跟貼 0
機器人半馬成績，超越人類紀錄

財聯社 2026-04-20 00:27:12
0 跟貼 0
LLM數據量大管飽，機器人數據卻連1%的起跑線都沒夠到？

量子位 2026-04-13 20:54:19
0 跟貼 0
零樣本 Sim-to-Real ！2

機器之心Pro 2026-03-25 11:40:23
0 跟貼 0
機器人打包運輸的正確方式

裝甲鏟史官 2026-02-22 10:41:15
0 跟貼 0
安心養蝦！從OpenClaw 看云上AI安全落地路徑

量子位 2026-04-18 19:55:39
0 跟貼 0
Agent輸出到底該用誰？卡帕西轉發：試試讓AI輸出HTML

量子位 2026-05-13 07:19:50
0 跟貼 0
大模型的魅力在于突發涌現的能力

量子位 2025-12-11 03:38:02
0 跟貼 0
AI第一次科研競賽中擊敗人類！Opus 4.7狂飆2930步創世界紀錄

新智元 2026-05-15 16:20:53
0 跟貼 0
荒野求生（機器狗全自主版），2025ATEC挑戰真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0
AI Agent是科技革命中的一次真正的范式轉移

量子位 2026-04-03 22:52:35
0 跟貼 0
讓你的龍蝦秒變電影《Her》里的Samantha

量子位 2026-03-23 20:37:07
0 跟貼 0
MIT研究生用NotebookLM兩天學完一學期課程

量子位 2026-03-22 10:50:49
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
對談樓天城：Harness會成為AI時代最關鍵的能力之一

量子位 2026-05-06 15:41:08
0 跟貼 0
大神程序員蒸餾自己，用16個skill給AI注入軟件工程之魂

量子位 2026-05-12 03:08:58
0 跟貼 0
如何點亮小龍蝦的牛馬技能包?

量子位 2026-03-18 12:51:26
0 跟貼 0
百度沈抖自曝：老忘吃藥，用AI做了個小程序

量子位 2026-03-27 11:25:23
0 跟貼 0
Anthropic的AI讀心術，讓人類讀懂大模型在想啥

量子位 2026-05-10 23:00:57
0 跟貼 0
這個時代必須以Agent為中心：三個趨勢回顧

量子位 2026-04-05 02:14:15
0 跟貼 0
從智能體到賽博員工，生產力智能涌現

機器之心Pro 2026-05-15 18:02:32
0 跟貼 0
博士生如何用龍蝦做知識管理？歡迎圍觀！

量子位 2026-03-26 23:23:30
0 跟貼 0
吳恩達炮轟「AI就業末日論」：販賣失業焦慮，其實就是一門生意

機器之心Pro 2026-05-15 18:05:31
0 跟貼 0
陶哲軒：AI不能全用，深度思考不行

量子位 2026-03-19 01:35:49
0 跟貼 0
OpenAI Codex進入手機，國產“龍蝦”們該醒醒了

鈦媒體APP 2026-05-15 17:36:17
0 跟貼 0
日本造球形攝影機器人，在國際空間站拍攝日常

裝甲鏟史官 2026-04-09 11:33:37
0 跟貼 0
小小的一個電機，拉著滿屋子的傳送帶，果然聰明人輕松賺錢！

貧窮貴公子啊 2026-05-12 05:53:46
1 跟貼 1
日本徹底急眼了！剛到上海中方甩出王炸，日網友：這本該是我們的

霽寒飄雪 2026-05-15 16:51:45
0 跟貼 0
日本全盤失控，高市早苗被逼到絕路，秘密向中國遞交緊急請求

隱龍天下 2026-05-15 02:16:23
0 跟貼 0

汽車要聞

手機 / 數碼

房產 / 家居

日本團隊蛇形機器人解鎖滾動前進新姿勢，能效提升10倍

兩年聯姻一地雞毛，傳蘋果OpenAI瀕臨決裂

媒體：中美元首會晤"刷屏" 特朗普用3個詞談中美關系

媒體：中美元首會晤"刷屏" 特朗普用3個詞談中美關系

德約科維奇買的球隊，從第6級聯賽升入法甲

方媛為何要來《桃花塢6》沒苦硬吃？

騰訊掉隊，馬化騰戳破真相

高爾夫GTI刷新紐北紀錄 ID. Polo GTI迎全球首秀

態度原創

華為首款超新星手表發布！離線定位守護安全、潮玩相機記錄成長

榜樣！從晴川新銳到第1名上岸華科大，她用奮斗書寫滾燙青春！

敦煌挖出王羲之書法！全卷2000字清晰如新！

用蘇繡的方式，打開江西婺源

首屆中國新文創市集暨潮玩游園會啟幕 一站式體驗全國優質文創

首屆中國新文創市集暨潮玩游園會啟幕一站式體驗全國優質文創