當我們切開一根香蕉,削掉一個土豆的皮,或是清洗一個形狀不規則的盤子時,我們很少會意識到自己大腦和雙手的配合是多么精妙。我們能毫不費力地適應各種物體的曲面、弧度和比例,即使是第一次見到的物體也能輕松上手。然而,這項對于人類來說如同本能的日常任務,卻一直是機器人領域難以逾越的鴻溝。
為什么機器人連削蘋果皮都那么困難?根本原因在于,香蕉、杯子、土豆這類曲面物體,不像平整的桌面,它們沒有一個全局統一的參考坐標系。在一個曲面上,“向前”或“沿著表面”的方向,在每一點都可能不同。這使得機器人很難將在一個物體上學到的技能(比如削一個直溜的黃瓜)應用到另一個形狀稍有不同的物體上(比如一個彎曲的黃瓜)。機器人學到的似乎總是一套僵硬的、針對特定物體的動作序列,而非通用的“技能”。
![]()
近日,一篇最新發表在國際頂級期刊Science Robotics的研究,為解決這一根本性挑戰帶來了曙光。研究人員們提出了一種名為“擴散方向場”(Diffused Orientation Fields)的創新方法,它為機器人打造了一套能夠實時適應任何物體幾何形狀的“智能導航系統”,讓機器人擁有了在復雜曲面物體上舉一反三、觸類旁通的能力。
![]()
01.
擴散方向場:為機器人打造隨形的“智能導航”
想象一下,要讓機器人在一個陌生的、凹凸不平的物體表面執行任務,我們首先需要給它一張地圖。傳統的地圖是固定的,比如一張平面的世界地圖,但在曲面物體上,這張平面地圖會因為褶皺和拉伸而完全失效。而“擴散方向場”則像一張具有彈性的地圖,可以平滑地“貼”在任何物體的表面,甚至能延伸到物體周圍的空間中。
這張“地圖”是如何繪制的呢?過程出奇地簡潔。機器人首先通過3D攝像頭快速掃描目標物體,獲得其原始的“點云”數據——即成千上萬個描述物體表面形狀的三維點集。接著,只需要在物體上指定幾個任務相關的“關鍵點”(Keypoints)。例如,在削香蕉皮的任務中,關鍵點可以簡單地設為香蕉的頭和尾。
有了點云和關鍵點,神奇的“擴散”過程就開始了。研究人員利用了物理學中描述熱量傳播的“熱方程”(一種偏微分方程),將關鍵點攜帶的方向信息,像一滴墨水滴入清水一樣,在整個物體點云表面平滑地擴散開來。這個過程最終會生成一個連續、光滑的“方向場”。這個場為機器人提供了一個“幾何支架”,在物體周圍的每一個點,機器人都擁有了一個隨物體表面幾何形狀而變化的局部參考坐標系。
簡單來說,無論機器人移動到哪里,它都能立刻知道哪是貼著表面的“前進”方向,哪是“向上”或“向下”的方向。如前圖所示,該方法接收點云和關鍵點作為輸入,首先在物體表面計算出一個擴散場,然后將其無縫擴展到整個工作空間,形成一個平滑變化、無處不在的局部方向指導。
02.
解耦任務與幾何:實現“一招鮮,吃遍天”
“擴散方向場”最核心的貢獻,在于它巧妙地將“任務”本身與物體的復雜“幾何形狀”分離開來,實現了“解耦”。
過去,一個“削皮”任務對于機器人來說,可能是一長串復雜的、包含數千個坐標點的運動軌跡。換一個稍有不同的物體,整套軌跡就得重新規劃或學習。而現在,借助“擴散方向場”,任務被簡化為在局部坐標系下的一系列極其簡單的“動作原語”(Local Action Primitives)。例如,“削皮”這個任務可以被描述為:“沿著局部x軸滑動,然后向下移動一點,再向上抬起一點”。
這套簡單的指令是完全通用的,因為它不包含任何特定物體的形狀信息。當機器人面對一根筆直的香蕉時,局部坐標系會引導它走直線;當面對一根彎曲的香蕉時,同樣的指令會因為局部坐標系的自然彎曲,而自動生成貼合香蕉弧度的削皮軌跡。機器人需要學習和記憶的,不再是僵化的動作,而是一套抽象、通用的技能“配方”。
![]()
研究團隊通過一系列實驗,有力地證明了這種方法的有效性。他們展示了機器人在從未見過的物體上成功執行切片、削皮和表面覆蓋等任務。機器人能夠將一個通用的任務模型,成功遷移到香蕉、梨等多個真實物體上,其動作軌跡平滑且精準地貼合了物體表面。
為了進行更嚴格的量化評估,研究人員創建了50個形狀各異、隨機變形的梨子模型,并在上面測試了“削皮”任務的遷移效果。他們將“擴散方向場”方法與其他幾種常用的機器人任務表示方法(如基于物體固定的笛卡爾坐標系、圓柱坐標系等)進行了對比。
![]()
結果如上圖所示,一目了然。在使用傳統方法時,遷移到不同形狀梨子上的削皮軌跡(圖C中(i)-(iii)列)差異巨大、雜亂無章(表現為圖中彩色曲線周圍的陰影區域非常寬)。這意味著機器人的動作一致性很差,任務成功率沒有保障。而使用“擴散方向-場”的方法(圖3C中iv列),50次任務的軌跡高度一致,方差極小(陰影區域非常窄),幾乎就像在同一個物體上重復執行一樣。這證明了該方法實現了高質量、高魯棒性的任務遷移。
03.
從遙操作到強化學習:強大、魯棒且通用
“擴散方向場”的價值遠不止于任務遷移,它更是一個功能強大、靈活通用的“中間件”,可以無縫集成到各種機器人控制框架中,全面提升機器人的智能化水平。
研究人員展示了它在三種主流控制模式下的應用:
在遙操作中,人類操作員不再需要小心翼翼地控制機器人的每一個姿態角度。他們只需通過手柄給出“沿著表面向前”或“靠近表面”等直觀指令,系統就會利用方向場自動保持工具與物體表面的正確姿態和距離,讓遠程操控變得更加輕松和直觀。
在軌跡優化中,方向場為運動規劃器提供了關于物體幾何的豐富信息(梯度)。規劃器可以輕松地定義“與表面保持固定距離”或“避開某個區域”等約束,并快速計算出完成復雜任務(如在物體表面繞過障礙物并到達目標點)的最優路徑。
在強化學習中,它的優勢更為突出。智能體可以在這個被大大簡化了的、與具體形狀無關的局部動作空間中進行學習,學習效率得到指數級提升。實驗證明,一個在簡單二維圓形上學習到的“到達-跟隨”策略,竟然可以直接“零樣本”遷移(zero-shot transfer)到一個復雜的、隨機生成的3D點云物體上并成功執行任務,而無需任何重新訓練。這在過去是難以想象的。
![]()
此外,該方法還表現出了出色的魯棒性。由于“擴散”過程天然具有平滑和去噪的特性,它對傳感器數據中的噪聲和不完整性(如因遮擋或物體反光造成的點云缺失)有很強的抵抗力。如下圖所示,即使在點云數據受到嚴重干擾(拓撲噪聲、幾何噪聲)的情況下,通過調整擴散參數(增加平滑度),系統依然能生成穩定、可靠的運動軌跡。
![]()
此外,該方法還能輕松擴展到包含多個物體的復雜、混亂場景中,如下圖所示,機器人在一堆雜物中準確地對一根香蕉進行切片操作。
![]()
總而言之,這項發表于Science Robotics的研究工作,通過引入“擴散方向場”這一數學工具,從根本上幫助解決機器人在曲面物體上進行通用操作的難題。它將復雜的幾何適應問題,巧妙地轉化為了一個簡單的、可遷移的局部動作執行問題。這一框架為開發更智能、更靈巧、更能適應非結構化環境的下一代機器人提供了新思路,讓我們離那個機器人能為我們削水果、洗碗的未來,又近了一步。
論文鏈接:
https://www.science.org/doi/10.1126/scirobotics.aea1762
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.