<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      實測第一:臥安 OneModel 1.7用一條隱式通路打通看懂到做對

      0
      分享至



      機器之心發布

      2026 年,世界動作模型(WAM)在具身智能領域逐漸成為一個集中討論的方向,英偉達等公司也陸續在這一領域投入資源。

      這類模型要做的事情,大致可以分成兩部分:一是從數據中學習現實世界里常見的變化規律,二是學習機器人能用來介入這些變化的各類動作。但一個懸而未決的問題是 —— 世界模型“看懂了”環境變化,動作策略卻依然“做不對”,中間的傳導斷層怎么補?

      最近,臥安機器人(OneRobotics,6600.HK)發布的OneModel 1.7 FrontoStria-RL給出了一種回答。該模型在LIBERO標準測試中取得99%平均成功率,超越 π0.5、GR00T-N1.5、OpenVLA-OFT;真機日常操作成功率99%,高精度任務97%,真人對打乒乓球接球91.2%。這組成績背后的核心不是更大的參數規模,而是一條從世界理解到動作執行的隱式傳導通路 ——Predictive Policy Latent,以及讓這條通路持續進化的RL 閉環機制。我們來拆解一下它的技術細節。



      圖 1:標準 LIBERO 平均成功率對比。One Model 1.7 以 99% 領先于 π0.5、GR00T-N1.5、OpenVLA-OFT 等主流公開模型。

      一、機器人在你家廚房,

      為什么總是 "看懂了卻做不對"?

      想象一個場景:機器人昨天在你家廚房洗完碗,順利把碗放回了櫥柜。今天你把碗架挪到了右邊,櫥柜門也換了個角度 —— 對人來說這根本不算事兒,但對機器人來說,這可能就是一個 "從沒見過的全新任務"。

      這不是個別現象。家庭環境是具身智能最難、也最有價值的戰場:沒有兩間完全相同的廚房,沒有兩個擺放一致的客廳,每天的任務組合也在不斷變化。機器人不僅要精確完成疊衣、端碗、收納等動作,還得在物品陌生、光照變化、戶型各異的情況下,仍能讀懂意圖并做出合理行動。更不用說拔插試管、倒咖啡豆這類容錯空間極小的高精度操作,或者真人對打乒乓球這種對實時感知和高速響應要求極高的極限場景。

      這背后的技術困境,可以歸結為當前兩條主流路線各自的瓶頸。

      VLA(Vision-Language-Action)路線做得很直接:把視覺觀測和語言指令端到端映射成機器人動作,在訓練數據覆蓋充分的場景中表現高效。但問題在于,物體位置變了、視角偏了、光照換了,動作策略就容易出錯;碰到多階段的復雜任務,也容易在中途丟失全局目標。

      World Model 路線走的是另一條路,試圖讓模型建立對環境狀態和任務演化的預測能力 —— 物體關系、空間結構、動作后果。理論上泛化潛力更強,但落地時有一個核心難題:世界模型 "看懂了",不代表動作策略就 "做對了"。如果用顯式的未來圖像或中間坐標來銜接動作模塊,會引入生成誤差、信息冗余和推理延遲;如果不做有效傳導,"理解世界" 和 "動得準" 之間就存在一道斷層。

      OneModel 1.7 要解決的核心問題,正是這道斷層。

      二、Predictive Policy Latent:

      打通斷層的隱式通路

      OneModel 1.7 FrontoStria-RL 采用臥安自研的 RL-Latent World Action Model 架構( RL-LWAM),其完整信息流如下:

      Instruction / Observation /SkillWorld ModelPredictive Policy LatentUnderstand ExpertAction Expert→ Robot Execution → RL / Success Memory / HITL ?



      圖 2:One Model 1.7 FrontoStria-RL 完整架構。 Predictive Policy Latent 作為核心傳導機制,連接 World Model、Understand Expert 與 Action Expert。

      整個架構由三個模塊組成:World Model 負責跨場景泛化,Understand Expert 負責任務理解與 Skill 調度,Action Expert 負責精準執行。但讓這三個模塊真正 "通" 起來的關鍵,是中間的Predictive Policy Latent

      "FrontoStria" 這個名字是什么意思?

      FrontoStria 來自神經科學中的 "額紋狀體通路"( Frontostriatal Pathway) —— 大腦中連接前額葉皮層(負責決策和規劃)與紋狀體(負責動作執行) 的神經回路。這條通路的核心功能,正是將高層認知決策傳導到底層運動執行。

      OneModel 1.7 的 Predictive Policy Latent 扮演的就是這條通路的角色:將 World Model 對場景的高層理解( "前額葉"),隱式傳導到 Action Expert 的動作生成( "運動皮層")。

      Predictive Policy Latent 具體怎么工作?

      傳統方案要把世界模型的理解傳給動作模塊,通常的做法是生成預測圖像( "我預測未來場景長這樣")或輸出顯式目標坐標( "目標物在 xyz 位置")。但這些方式有三個代價:像素冗余(傳了很多與決策無關的信息)、生成幻覺(預測圖像本身可能有誤差)、模塊割裂(上下游耦合度低)。

      Predictive Policy Latent 的做法不同。 它用一種面向動作策略的隱式表征來替代顯式信號 ——

      • 訓練階段:模型可以 "看到" 動作執行后的未來觀測結果,以此塑造對任務后果的理解,形成隱式的物理推理表征
      • 部署階段:模型不再依賴未來信息,僅憑當前觀測即可輸出等效的調制信號

      換句話說,這條隱式通路在訓練時用 "未來信息" 來教會模型什么是好的動作決策方向,部署時則只靠當前觀測就能做出等效判斷 — 信息密度更高,推理更快,且不引入生成式噪聲。

      這正是 OneModel 1.7 區別于現有方案的核心設計:不是把 VLA 和 World Model 簡單拼在一起,而是用一條隱式通路真正把世界理解傳導到動作執行。

      三、RL 閉環 + Retrieve-then-Steer:

      讓通路持續進化

      光打通這條通路還不夠。訓練完成后模型參數固定,面對真實部署中的長尾場景 — 手滑了、物體形變了、用戶臨時介入了 — 零樣本泛化總有邊界。

      OneModel 1.7 的第二個核心設計是讓這條通路不是一次性的,而是持續增強的。這也是模型代號中 "RL" 的含義。

      強化學習閉環

      在明確獎勵、 安全約束和人在環監督( HITL)下,模型通過真實任務反饋進行策略優化,突破模仿學習 "只能模仿示范數據" 的上限,發現更穩健、更高效的執行路徑。

      Retrieve-then-Steer:越用越好的成功記憶

      這背后有一個關鍵觀察:現有評測把每次測試視為獨立的零樣本試驗,但真實機器人往往在同一個或緩慢變化的環境中反復操作 — 昨天成功洗過的碗,今天大概率還是用類似的方式洗。成功執行本身就是 "經過環境驗證的可靠行為模式"。

      具體機制如下:

      1. 存儲:部署過程中,將經過進度校準的成功觀測 - 動作片段存入長期記憶(Success Memory)
      2. 檢索:推理時,檢索與當前狀態相關的動作塊
      3. 過濾:通過軌跡級一致性過濾不一致的候選
      4. 引導:聚合為精英動作先驗,通過 Confidence-Adaptive Prior Guidance 注入 flow-matching 動作采樣器的中間狀態,根據檢索置信度自適應調整引導強度

      這意味著 OneModel 部署后可以 "越用越好"— 同一個家庭的環境相對固定,機器人每天積累的成功經驗會持續提升后續任務的成功率,而且這個過程是輕量級的、非參數的。



      圖 3:SimplerEnv 平均成功率對比。 Retrieve-then-Steer 將 CogACT 的平均成功率從 75.8% 提升至 79.5%,提升 3.7 個百分點。

      RL 閉環和 Retrieve-then-Steer 的關系是互補的:RL 解決的是能力上限問題(突破模仿學習天花板),Retrieve-then-Steer 解決的是部署適應問題(無需重訓即可自適應)。兩條路徑共同讓 Predictive Policy Latent 這條傳導通路從 "一次性連通" 變成 "持續增強"。

      四、支撐通路的兩個關鍵模塊

      Predictive Policy Latent 這條主通路要跑得好,還需要兩個支撐模塊在通路的中段和末端分別解決問題。

      Understand Expert + Skill:通路中段的任務規劃

      真實操作任務往往包含明確的階段劃分和子目標依賴:疊衣服要先展平、再對折、最后整理邊緣;洗碗機操作要識別碗碟類型、選擇擺放位置、確認關門。這些結構化的操作規程,既不屬于 World Model 的環境建模,也不屬于 Action Expert 的動作生成,而是連接理解與執行的中間層。

      Understand Expert 在架構中承擔的就是這個角色:接收 Predictive Policy Latent 的調制信號,對任務進行結構化分解 —— 識別階段、確定子目標依賴、調度對應的 Skill 序列。面對新任務組合時可以復用已有 Skill,面對長流程時不丟失階段目標。

      MCF-Proto:通路末端的動作魯棒性

      當前 VLA 模型的骨干( backbone)、預訓練和數據集都在快速進化,但 action head 幾乎是同質的 —— 大多在固定的世界坐標系下直接預測動作命令。這種方式對相機視角變化和機器人初始位姿偏差非常敏感。



      一個有趣的發現是:無需顯式的方向標簽,學到的局部坐標系會自發形成穩定的幾何結構,其坐標軸與示教中末端執行器的運動方向高度一致。動作表征也變得更加緊湊,由更少的主方向捕獲變化,并由共享原型更規則地組織起來。

      在 LIBERO-plus 擾動測試中, MCF-Proto 在七類擾動中六類取得最優結果。最值得關注的是兩類幾何擾動 ——Camera(相機視角變化) 領先最強基線 3.3 個百分點(69.7% vs. 66.4%),Robot(機器人初始位姿偏差) 領先 15.7 個百分點(66.0% vs. 50.3%)。這兩類恰恰是家庭環境中最常見、也最影響動作執行的變化。



      圖 4:LIBERO-plus 七類擾動魯棒性對比。 MCF-Proto 在 Camera 和 Robot 兩類幾何擾動下優勢最為顯著。



      圖 5:One Model 1.7 FrontoStria-RL 四大核心技術模塊總覽。

      五、OneModel 1.7 與主流具身智能模型對比

      為了更清晰地理解 OneModel 1.7 在當前技術格局中的位置,以下將其與主流具身智能模型做一個架構層面的對比:



      OneModel 1.7 的兩個獨特之處在這張表中非常清晰:

      1. 唯一的隱式傳導通道。從 "規劃 / 中間表征" 一行可以看到,π0.5 和 GR00T N1.7 沒有顯式規劃表征;π0.7 通過未來圖像或子目標圖像承載世界模型輸出,DreamZero 進一步生成未來視頻。OneModel 1.7 走了一條不同的路:通過 Predictive Policy Latent 將世界模型的高層理解以隱式表征直接傳導到動作策略,不生成任何中間圖像或視頻,實現了世界理解到動作執行之間的低冗余連通。

      2. 唯一的強化學習閉環。從 "強化學習閉環" 一行可以看到,π0.5、GR00T N1.7、π0.7 和 DreamZero 的核心范式都不依賴部署后的強化學習閉環。OneModel 1.7 的定位不同: 它把隱式 WAM 與強化學習結合起來,讓機器人在日常使用中積累成功經驗,并通過 Retrieve-then-Steer 在不更新模型參數的情況下提升后續任務的成功率。

      六、真機驗證:從疊衣服到打乒乓球

      benchmark 成績只是一部分。OneModel 1.7 在真實機器人平臺上覆蓋了三類難度梯度的任務。

      日常操作:平均成功率 99%

      洗衣服、疊衣服、洗碗機操作、傳送帶拿取物品 —— 這些任務涉及柔性物體操作、多階段流程和環境多樣性,要求模型在泛化理解與穩定執行之間取得平衡。

      高精度操作:平均成功率 97%

      拔插試管、疊紙杯、倒咖啡豆 —— 容錯空間極小,對末端位置精度、姿態控制和力控穩定性要求很高。MCF-Proto 圍繞局部運動結構組織動作原型的設計,在此類任務中體現出顯著優勢。

      極限動態:乒乓球接球成功率 91.2%

      真人對打乒乓球對實時感知、軌跡預測和高速動作生成要求極高,是 "高動態 + 高精度" 的典型代表。World Model 提供來球軌跡的快速預測,Action Expert 在極短時間窗口內生成精準動作,RL 閉環通過大量對打訓練持續優化擊球策略。



      圖 6:日常操作與高精度任務真機驗證成功率。



      圖 7:真人對打乒乓球動作階段成功率。接球成功率達到 91.2%。



      總結

      OneModel 1.7 FrontoStria-RL回應的是具身智能從實驗室走向真實部署時面臨的一組系統性問題 —— 世界模型的理解如何傳導到動作執行、任務如何結構化分解、動作如何對環境擾動保持魯棒、模型如何在部署后持續進化。

      它給出的回答是:用Predictive Policy Latent建立一條隱式通路,讓世界理解真正驅動動作策略;用Understand Expert + Skill體系為長程任務提供結構化規劃;用MCF-Proto讓動作表達對幾何擾動保持穩定;用RL 閉環和 Retrieve-then-Steer讓整個系統越用越好。

      家庭機器人要真正走進日常使用,靠的不是更大的參數規模,也不是在特定場景下偶爾成功的演示,需要的是一套能同時處理泛化、執行和持續更新這三件事的模型系統。

      OneModel 1.7 FrontoStria-RL 是臥安在這個方向上的一次階段性工作。對臥安而言,模型發布并不是孤立的技術事件,而是與其家庭機器人本體、真實場景數據采集和服務部署體系共同構成閉環。隨著臥安機器人圍繞真實家庭與服務場景推進 OneModel 模型的迭代,相信在不久,機器人將從 “能看懂、能行動”,進一步走向 “能適應、能進化、能持久可靠地工作”。



      • 論文鏈接:https://arxiv.org/abs/2605.11809



      • 論文鏈接:https://arxiv.org/abs/2605.10094
      • 官網詳情:https://www.onerobot.com/OneModel

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      馬浚偉任上市集團CEO年薪252萬,就職首日曬辦公室,屋內滿是綠植

      馬浚偉任上市集團CEO年薪252萬,就職首日曬辦公室,屋內滿是綠植

      可樂談情感
      2026-05-20 16:48:03
      特斯拉Model 3性能三連降:4.2秒變6.2秒

      特斯拉Model 3性能三連降:4.2秒變6.2秒

      算力游俠
      2026-05-21 01:21:02
      520杭州姑娘嫁黑皮外國人,爸媽曾震驚反對,評論區沒有半分祝福

      520杭州姑娘嫁黑皮外國人,爸媽曾震驚反對,評論區沒有半分祝福

      譚談社會
      2026-05-20 21:58:45
      馬斯克轉發重慶東站,一字沒寫,美網友破防:為什么我們做不到?

      馬斯克轉發重慶東站,一字沒寫,美網友破防:為什么我們做不到?

      有范又有料
      2026-05-20 17:36:04
      前國手劉丁碩直播時手舉6個蛋暗諷樊振東,現已關閉社媒評論

      前國手劉丁碩直播時手舉6個蛋暗諷樊振東,現已關閉社媒評論

      懂球帝
      2026-05-21 14:05:17
      熱議第三批禁足名單:金元競爭太畸形了;大概率還有第四批

      熱議第三批禁足名單:金元競爭太畸形了;大概率還有第四批

      懂球帝
      2026-05-21 16:02:20
      為什么國家最高規格的宴會只選可口可樂?

      為什么國家最高規格的宴會只選可口可樂?

      流蘇晚晴
      2026-05-19 19:23:40
      籃壇反腐!27歲女籃名將終身禁賽,17載苦練付諸東流紅線絕不能碰

      籃壇反腐!27歲女籃名將終身禁賽,17載苦練付諸東流紅線絕不能碰

      北緯的咖啡豆
      2026-05-21 19:36:44
      劉國梁到底有多狠?棄用郝帥和陳玘,用天才前途換國乒的萬無一失

      劉國梁到底有多狠?棄用郝帥和陳玘,用天才前途換國乒的萬無一失

      老瑋是個手藝人
      2026-03-27 14:46:10
      美國對中國統一最新結論:大陸只要按兵不動,越晚統一代價越小

      美國對中國統一最新結論:大陸只要按兵不動,越晚統一代價越小

      蜉蝣說
      2026-05-21 21:05:32
      哈滕拉卡斯爾頭發不犯規 當值裁判曾穿SGA簽名鞋

      哈滕拉卡斯爾頭發不犯規 當值裁判曾穿SGA簽名鞋

      體壇周報
      2026-05-21 14:31:15
      外交部:中方對阿聯酋核電站相關設施遭受襲擊深表關切,反對武裝攻擊和平核設施

      外交部:中方對阿聯酋核電站相關設施遭受襲擊深表關切,反對武裝攻擊和平核設施

      環球網資訊
      2026-05-19 15:51:06
      胰島“禍首”被揪出!是白糖的六倍,醫生:吃的越多,血糖越失控

      胰島“禍首”被揪出!是白糖的六倍,醫生:吃的越多,血糖越失控

      蜉蝣說
      2026-05-21 21:15:34
      約會時女人說去廁所,其實是在給你兩個暗示,聽懂的都不是凡人

      約會時女人說去廁所,其實是在給你兩個暗示,聽懂的都不是凡人

      心理觀察局
      2026-05-18 09:11:14
      上海交大私吞獎金后續:處分落地,4個頭銜被擼,本人主動退暑校

      上海交大私吞獎金后續:處分落地,4個頭銜被擼,本人主動退暑校

      奇思妙想草葉君
      2026-05-20 14:57:34
      中俄東北虎數量差距斷崖:俄羅斯750只,中國的數量令人意外

      中俄東北虎數量差距斷崖:俄羅斯750只,中國的數量令人意外

      混沌錄
      2026-05-19 23:49:37
      高山變深坑!亞洲最深鐵礦一百多年被挖700米,如今要用13年回填

      高山變深坑!亞洲最深鐵礦一百多年被挖700米,如今要用13年回填

      全城探秘
      2026-05-19 15:11:51
      國際足聯再送“大禮包”?66隊世界杯,國足再進不去真沒借口了!

      國際足聯再送“大禮包”?66隊世界杯,國足再進不去真沒借口了!

      曹老師評球
      2026-05-21 21:16:52
      魯比奧說了實話:不是因為臺灣距離太遠,而是美軍真的打不贏!

      魯比奧說了實話:不是因為臺灣距離太遠,而是美軍真的打不贏!

      阿龍聊軍事
      2026-05-20 16:40:25
      曝斯洛特將被利物浦解雇,花4.8億卻四大皆空,名帥或接任

      曝斯洛特將被利物浦解雇,花4.8億卻四大皆空,名帥或接任

      林子說事
      2026-05-21 19:06:16
      2026-05-21 21:44:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      13055文章數 142651關注度
      往期回顧 全部

      科技要聞

      小米YU7 GT正式發布:售價38.99萬元

      頭條要聞

      中紀委連打三"虎":一人被指違規核發機動車號牌

      頭條要聞

      中紀委連打三"虎":一人被指違規核發機動車號牌

      體育要聞

      常住人口7000的小鎮,擁有了一支德甲球隊

      娛樂要聞

      反轉!金秀賢與金賽綸未成年時交往不實

      財經要聞

      潮水退去,裸泳的一定不止五糧液

      汽車要聞

      后驅+閃充+激光雷達 第三代元PLUS上市售11.99萬元起

      態度原創

      本地
      房產
      藝術
      時尚
      公開課

      本地新聞

      用云錦的方式,打開江蘇南京

      房產要聞

      順德澐璟樓王『澐冠』啟幕|一場高階共鳴的靜奢美學之約

      藝術要聞

      崔雪冬 2026年油畫新作

      亞麻,讓人愛的高級清爽

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 人人妻人人做人人爽| 色噜噜狠狠成人综合| jlzz大jlzz大全免费| 日本一区二区三区久久久| 中文字幕人妻精品免费| 欧美日韩国产在线人成dvd | 亚洲欧美自偷自拍视频图片| 久久国产精品娇妻素人| 国产成人影院一区二区三区| 狠狠综合久久av一区二| 好男人中文资源在线观看| 欧美午夜色大片在线观看免费| 国产精品美女白浆喷水| 久久久这里只有精品10| 在线天堂最新版资源| 精品亚洲AⅤ无码午夜在线| 亚洲AV成人片| 日韩乱码免费一区二区三区| 亚洲成a人片7777| 亚洲真人无码永久在线| 日韩欧美aⅴ综合网站发布| 日本高清免费AAAAA大片视频| 国产激情免费视频在线观看| jizz人妻| 人妻久久999精品1024| 无码人妻毛片丰满熟妇精品区| 日韩人妻不卡一区二区三区| 国产对白老熟女正在播放| 人妻丰满熟妇无码区免费| 国产91PORN中文| 国产精品亚洲综合久久| 国产一级av在线播放| 国产香蕉尹人在线视频你懂的| 国产专区一线二线三线码| 亚洲精品国产AV| 国产性色av高清在线观看| 无码av秘?一区二区三区电车| 国产无套露脸在线观看| 亚洲黄色短视频| 免费无码黄网站在线观看| 九九热精品在线观看|