![]()
編輯|Sia
那個一句話生成完整物理世界、做出 GitHub 最大開源機器人項目的團隊,又出手了。
![]()
去年底,Genesis 物理引擎一經開源,就在機器人圈刷屏:只需要一句話,就能生成可交互的物理世界,用來訓練和測試機器人。
現在,這家創下硅谷具身智能賽道最大種子輪融資紀錄(1.05 億美元)的 Genesis AI,終于公布了自己的首個機器人基礎模型 GENE-26.5。
![]()
它能自主完成一個涉及 20 多步操作的烹飪任務,還能解魔方、彈鋼琴、制作奶昔、操作實驗室移液、整理線束…… 這些是長時序,需要精細力控、雙手協調、in-hand manipulation 和工具使用的任務,遠超很多機器人 demo 的簡單抓取或重復動作,且是完全自主、1x 真實速度播放。
Genesis 表示,這些任務不是為單點 demo 單獨設計的,而是由同一個模型、同一套硬件平臺、同一套數據策略和同一套控制棧完成。
視頻一經放出,立刻刷屏,也把不少機器人從業者看炸了。
Eclipse Ventures 合伙人 Seth Winterroth 在社交平臺上直言,自己在機器人行業前沿待了十多年,見過過去幾年幾乎所有號稱實現「通用操作能力」突破的團隊。
但 Genesis 放出的東西,「和自己之前見過的完全不是一個級別」。
![]()
![]()
![]()
![]()
![]()
![]()
GENE-26.5 能做什么?
官方演示里,最有代表性的任務是做飯。
這是一個約 4 分鐘的長程任務,包含 20 多個子任務。機器人需要單手打蛋、切番茄、用毛巾、鹽磨、打蛋器、刀、鍋鏟、煎鍋等工具,還要完成雙手協同操作。
![]()
另一個更接近商業化應用的場景,是實驗室移液。
機器人要抓取移液槍、插入槍頭、轉移液體、密封試管、按下離心機的小按鈕,再把試管放入轉子中。這個流程要求毫米級精度、工具使用、精細手部協調,以及對小尺寸物體的穩定操作。
![]()
還有一個炫技但很說明問題的任務:解魔方。Genesis 稱,這是他們所知第一次有通用雙手機器人系統完成魔方求解。它不是靠特殊機械夾具,而是用外部求解器生成動作指令,再由模型執行。
![]()
他們甚至還讓機器人挑戰了 Rush E 鋼琴曲。這首曲子以高難度著稱,超出普通人類極限。前段時間,朗朗在巴黎里昂車站與鋼琴博主斗琴彈的就是這個曲子。
![]()
工業場景里,則包括線束整理。這被 Genesis 稱為汽車行業的圣杯任務之一,因為線纜、膠帶等軟體物體非常難處理,需要雙手協同、柔性物體控制和精確纏繞。
![]()
更關鍵的是,對于演示任務中的大多數挑戰性技能,GENE 只需要不到 1 小時的任務特定機器人數據。對于 20 秒以內的技能,這相當于少于 200 條 episode。
這正是 Genesis 想證明的能力:不是每個任務都從零訓練,而是讓機器人越來越接近少量數據快速部署。
不是只把模型訓大
然而,Genesis 并不認為通用操作能靠「把模型訓大」直接解決。
Genesis 聯合創始人兼 CEO 周銜的說法:
模型一直是目標,因為更好的模型意味著更好的智能。
但他們很快意識到,光做模型還不夠。機器人不是純數字 AI,它需要模型、傳感器、執行器、控制系統、數據采集和評測體系一起工作。
任何一層不夠強,都會拖累整體表現。
于是,Genesis 選擇了全棧路線。GENE-26.5 也不是一個孤立模型,而是一整套系統,包括:
接近人手的機器人硬件、低成本人類數據采集體系、從零構建的仿真評測棧、面向機器人的多模態基礎模型,以及低延遲高精度控制系統。
這就是 Genesis 所說的 full-stack robotics。
仿真,成了模型迭代加速器
機器人模型還有一個老問題:評測太慢。一個機器人、一個人類評估員、一次只能跑一個任務。每次模型 checkpoint 都要實機測試,效率極低。
Genesis 的解法,是把仿真系統作為閉環評測核心。
他們認為,真實世界評測當然重要,但仿真在可控性、可復現性和規模化上優勢巨大。GENE-26.5 的開發中,Genesis 構建了大量仿真評測任務,覆蓋不同光照、背景、物體屬性、場景配置和任務指令。
![]()
官方給出的一個說法是:圖中的每個數據點都代表 200 個評測設置、超過 150 小時機器人執行時間;如果放到真實世界里做,整張圖需要 2700 小時的人機評測。
這也是他們去年開源 Genesis 物理引擎的意義所在。仿真不是展示工具,而是機器人基礎模型迭代的加速器。
一雙「人手」,為什么這么重要?
其新一代 Genesis Hand 1.0,被設計成和人手 1:1 尺寸匹配,擁有 20 個主動、可反驅自由度,手掌和手指覆蓋柔性材料,用來模擬人類皮膚的軟接觸特性。
![]()
![]()
為什么一定要做人形手?今天很多機器人公司還在用兩指夾爪,因為它簡單、穩定、工程上好控制。但問題也很明顯:它和人類真實操作世界的方式差太遠。
Genesis 的判斷是,如果機器人手能盡可能接近人手,就能大幅縮小機器人研究里常說的「具身差距」。這樣一來,人類日常工作中的動作數據,就更容易遷移到機器人身上。
這也是 Genesis 自研機器人手的核心邏輯:不是為了炫技,而是為了收集更多可用數據。
公司聯合創始人 Théophile Gervet 表示,接近人手的設計可以讓他們收集到比過去更多的數據,從而訓練出能完成更多任務的模型。
真正的關鍵,是那只數據手套
在技術博客里,Genesis 反復強調一個觀點:世界上最有價值的物理技能,藏在人類雙手的隱性知識里。
裝配工的手感、實驗員的精度、廚師的速度,這些能力過去幾乎沒有被系統記錄下來。為此,Genesis 構建了一個以人為中心的數據引擎,主要包括三類數據:
- 一類是手套數據,采集高精度手部運動和觸覺信號;
- 一類是第一視角視頻,記錄真實任務中的自然行為;
- 還有一類是第三視角視頻,用互聯網規模數據覆蓋更多物理交互場景。
![]()
其中最關鍵的,是他們自研的數據采集手套。這只手套使用 EMF 手指追蹤和密集觸覺傳感,可以在不明顯干擾人類工作的情況下,把真實工作過程變成機器人訓練數據。
Genesis 的設想是,未來實驗室技師、制造業工人等都可以在正常工作時佩戴這種手套。相比笨重的數據采集設備,它更輕、更便宜,也更接近很多行業本來就在使用的安全手套。
這也是 Genesis 給出的通用操作擴展路徑:先在人類演示數據上預訓練,再用少量機器人數據對齊,最后通過真實世界和仿真反饋持續迭代。
不過,這里也有一個現實問題:工人是否愿意戴著手套和攝像頭,去訓練未來可能替代自己的機器人?
Genesis 方面目前還沒有給出明確答案,只表示相關細節還沒完全確定,是否額外支付報酬也會由客戶和員工之間決定。
![]()
![]()
![]()
這些結果共同突顯了一個明顯的趨勢:擴展數據和計算能力可以提高泛化和適應效率。
為了讓模型真正聽話,他們還重做了控制棧
Genesis 還在博客里披露了一個容易被忽略、但非常關鍵的細節:他們替換了雙臂機器人原廠控制器,自己重寫了一套控制中間件。
原因是,機器人執行動作時,模型輸出和真實電機動作之間會累積延遲、跟蹤誤差和控制器偽影。
對于從人類動作中學習的機器人來說,這些誤差會放大人到機器人的差距。
Genesis 自研控制系統后,端到端延遲最低可做到3 毫秒;在 15cm 圓形軌跡跟蹤測試中,原廠控制器平均誤差約20mm,他們的系統降到約2mm,相當于提升一個數量級。
![]()
Genesis AI 的自研硬件與模型在控制精度上,相比于現成解決方案(Off-the-shelf)的顯著優勢。
這解釋了為什么 Genesis 一再強調「全棧」。不是為了技術敘事好聽,而是因為在機器人里,模型、硬件、控制、數據和評測必須同時成立。
下一個目標:不只是手,而是全身機器人
GENE-26.5 這個名字也有玄機:其中的26.5 指向 2026 年 5 月
Genesis 表示,這只是第一版,之后還會快速迭代。公司認為,機器人模型迭代的真正瓶頸在評估,而他們自研的仿真系統可以幫助加速訓練和測試。
總結來看,GENE-26.5 不是 Genesis 的終點,更像是它的第一張系統能力展示牌。它想證明的是:通用機器人并不是先學會走路,再慢慢學會干活。
相反,真正有價值的入口,可能是一雙能穩定、靈巧、可泛化地和世界接觸的手
因為大多數體力勞動,本質上不是機器人在世界里移動,而是改變世界。導航可以把世界簡化成障礙物和可通行空間;行走主要處理和地面的接觸,規律相對穩定。
但操作不一樣。機器人要面對未知物體的形狀、重量、摩擦、動態變化,還要在長任務鏈里保持毫米級精度。一個動作偏幾毫米,后面可能全錯。
所以 Genesis 認為,機器人如果能可靠地和物理世界發生復雜接觸,其他能力才有意義。
Genesis 的路線也很清晰:用接近人手的硬件縮小具身差距;用人類工作數據擴大訓練規模;用仿真系統加速閉環評測;用低延遲控制減少執行誤差;最后,把這一切喂給機器人基礎模型。
也難怪投資人會把它稱作「最強通用操作演示」。
公司接下來還計劃發布首個通用機器人,而且不是只有一雙手,而是完整的全身機器人。換句話說,Genesis 這次展示的不是終點,而是起手式。
機器人領域,新的狠角色已經亮牌。
https://www.genesis.ai/blog/gene-26-5-advancing-robotic-manipulation-to-human-level
文中視頻鏈接:https://mp.weixin.qq.com/s/6jbIVQzSQ2nf1HY1xk-BOg
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.