網易首頁 > 網易號 > 正文申請入駐

Sci Robot重磅：科學家讓機器人在復雜曲面實現通用任務遷移

2026-04-23 20:43:11　來源: 機器人大講堂

安徽舉報

分享至

當我們切開一根香蕉，削掉一個土豆的皮，或是清洗一個形狀不規則的盤子時，我們很少會意識到自己大腦和雙手的配合是多么精妙。我們能毫不費力地適應各種物體的曲面、弧度和比例，即使是第一次見到的物體也能輕松上手。然而，這項對于人類來說如同本能的日常任務，卻一直是機器人領域難以逾越的鴻溝。

為什么機器人連削蘋果皮都那么困難？根本原因在于，香蕉、杯子、土豆這類曲面物體，不像平整的桌面，它們沒有一個全局統一的參考坐標系。在一個曲面上，“向前”或“沿著表面”的方向，在每一點都可能不同。這使得機器人很難將在一個物體上學到的技能（比如削一個直溜的黃瓜）應用到另一個形狀稍有不同的物體上（比如一個彎曲的黃瓜）。機器人學到的似乎總是一套僵硬的、針對特定物體的動作序列，而非通用的“技能”。

近日，一篇最新發表在國際頂級期刊Science Robotics的研究，為解決這一根本性挑戰帶來了曙光。研究人員們提出了一種名為“擴散方向場”（Diffused Orientation Fields）的創新方法，它為機器人打造了一套能夠實時適應任何物體幾何形狀的“智能導航系統”，讓機器人擁有了在復雜曲面物體上舉一反三、觸類旁通的能力。

01.

擴散方向場：為機器人打造隨形的“智能導航”

想象一下，要讓機器人在一個陌生的、凹凸不平的物體表面執行任務，我們首先需要給它一張地圖。傳統的地圖是固定的，比如一張平面的世界地圖，但在曲面物體上，這張平面地圖會因為褶皺和拉伸而完全失效。而“擴散方向場”則像一張具有彈性的地圖，可以平滑地“貼”在任何物體的表面，甚至能延伸到物體周圍的空間中。

這張“地圖”是如何繪制的呢？過程出奇地簡潔。機器人首先通過3D攝像頭快速掃描目標物體，獲得其原始的“點云”數據——即成千上萬個描述物體表面形狀的三維點集。接著，只需要在物體上指定幾個任務相關的“關鍵點”（Keypoints）。例如，在削香蕉皮的任務中，關鍵點可以簡單地設為香蕉的頭和尾。

有了點云和關鍵點，神奇的“擴散”過程就開始了。研究人員利用了物理學中描述熱量傳播的“熱方程”（一種偏微分方程），將關鍵點攜帶的方向信息，像一滴墨水滴入清水一樣，在整個物體點云表面平滑地擴散開來。這個過程最終會生成一個連續、光滑的“方向場”。這個場為機器人提供了一個“幾何支架”，在物體周圍的每一個點，機器人都擁有了一個隨物體表面幾何形狀而變化的局部參考坐標系。

簡單來說，無論機器人移動到哪里，它都能立刻知道哪是貼著表面的“前進”方向，哪是“向上”或“向下”的方向。如前圖所示，該方法接收點云和關鍵點作為輸入，首先在物體表面計算出一個擴散場，然后將其無縫擴展到整個工作空間，形成一個平滑變化、無處不在的局部方向指導。

02.

解耦任務與幾何：實現“一招鮮，吃遍天”

“擴散方向場”最核心的貢獻，在于它巧妙地將“任務”本身與物體的復雜“幾何形狀”分離開來，實現了“解耦”。

過去，一個“削皮”任務對于機器人來說，可能是一長串復雜的、包含數千個坐標點的運動軌跡。換一個稍有不同的物體，整套軌跡就得重新規劃或學習。而現在，借助“擴散方向場”，任務被簡化為在局部坐標系下的一系列極其簡單的“動作原語”（Local Action Primitives）。例如，“削皮”這個任務可以被描述為：“沿著局部x軸滑動，然后向下移動一點，再向上抬起一點”。

這套簡單的指令是完全通用的，因為它不包含任何特定物體的形狀信息。當機器人面對一根筆直的香蕉時，局部坐標系會引導它走直線；當面對一根彎曲的香蕉時，同樣的指令會因為局部坐標系的自然彎曲，而自動生成貼合香蕉弧度的削皮軌跡。機器人需要學習和記憶的，不再是僵化的動作，而是一套抽象、通用的技能“配方”。

研究團隊通過一系列實驗，有力地證明了這種方法的有效性。他們展示了機器人在從未見過的物體上成功執行切片、削皮和表面覆蓋等任務。機器人能夠將一個通用的任務模型，成功遷移到香蕉、梨等多個真實物體上，其動作軌跡平滑且精準地貼合了物體表面。

為了進行更嚴格的量化評估，研究人員創建了50個形狀各異、隨機變形的梨子模型，并在上面測試了“削皮”任務的遷移效果。他們將“擴散方向場”方法與其他幾種常用的機器人任務表示方法（如基于物體固定的笛卡爾坐標系、圓柱坐標系等）進行了對比。

結果如上圖所示，一目了然。在使用傳統方法時，遷移到不同形狀梨子上的削皮軌跡（圖C中(i)-(iii)列）差異巨大、雜亂無章（表現為圖中彩色曲線周圍的陰影區域非常寬）。這意味著機器人的動作一致性很差，任務成功率沒有保障。而使用“擴散方向-場”的方法（圖3C中iv列），50次任務的軌跡高度一致，方差極小（陰影區域非常窄），幾乎就像在同一個物體上重復執行一樣。這證明了該方法實現了高質量、高魯棒性的任務遷移。

03.

從遙操作到強化學習：強大、魯棒且通用

“擴散方向場”的價值遠不止于任務遷移，它更是一個功能強大、靈活通用的“中間件”，可以無縫集成到各種機器人控制框架中，全面提升機器人的智能化水平。

研究人員展示了它在三種主流控制模式下的應用：

在遙操作中，人類操作員不再需要小心翼翼地控制機器人的每一個姿態角度。他們只需通過手柄給出“沿著表面向前”或“靠近表面”等直觀指令，系統就會利用方向場自動保持工具與物體表面的正確姿態和距離，讓遠程操控變得更加輕松和直觀。

在軌跡優化中，方向場為運動規劃器提供了關于物體幾何的豐富信息（梯度）。規劃器可以輕松地定義“與表面保持固定距離”或“避開某個區域”等約束，并快速計算出完成復雜任務（如在物體表面繞過障礙物并到達目標點）的最優路徑。

在強化學習中，它的優勢更為突出。智能體可以在這個被大大簡化了的、與具體形狀無關的局部動作空間中進行學習，學習效率得到指數級提升。實驗證明，一個在簡單二維圓形上學習到的“到達-跟隨”策略，竟然可以直接“零樣本”遷移（zero-shot transfer）到一個復雜的、隨機生成的3D點云物體上并成功執行任務，而無需任何重新訓練。這在過去是難以想象的。

此外，該方法還表現出了出色的魯棒性。由于“擴散”過程天然具有平滑和去噪的特性，它對傳感器數據中的噪聲和不完整性（如因遮擋或物體反光造成的點云缺失）有很強的抵抗力。如下圖所示，即使在點云數據受到嚴重干擾（拓撲噪聲、幾何噪聲）的情況下，通過調整擴散參數（增加平滑度），系統依然能生成穩定、可靠的運動軌跡。

此外，該方法還能輕松擴展到包含多個物體的復雜、混亂場景中，如下圖所示，機器人在一堆雜物中準確地對一根香蕉進行切片操作。

總而言之，這項發表于Science Robotics的研究工作，通過引入“擴散方向場”這一數學工具，從根本上幫助解決機器人在曲面物體上進行通用操作的難題。它將復雜的幾何適應問題，巧妙地轉化為了一個簡單的、可遷移的局部動作執行問題。這一框架為開發更智能、更靈巧、更能適應非結構化環境的下一代機器人提供了新思路，讓我們離那個機器人能為我們削水果、洗碗的未來，又近了一步。

論文鏈接：

https://www.science.org/doi/10.1126/scirobotics.aea1762

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.