允中 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
后空翻、跑酷、單手抓舉幾十公斤……
過去兩年,人形機(jī)器人最出圈的高光時(shí)刻,幾乎都發(fā)生在精心布光的舞臺上。
但鏡頭之外,有一個(gè)更樸素的問題始終懸而未決:它到底什么時(shí)候能走進(jìn)你家,穩(wěn)穩(wěn)端起一杯水、收好一桌碗筷、把臟衣籃抱進(jìn)洗手間?
5月20日,極佳視界沒有再用“五年內(nèi)”這類含糊措辭來搪塞。它把通用人形機(jī)器人真機(jī),直接推進(jìn)了武漢光谷一處真實(shí)的居民社區(qū):
那里有人住、有孩子把玩具撒一地、家具隨時(shí)會被挪動(dòng)位置。
在發(fā)布會現(xiàn)場,極佳視界還首次完整披露了過去三年沉淀下來的“雙金字塔”技術(shù)體系。
一邊是數(shù)據(jù)金字塔,從互聯(lián)網(wǎng)視頻、真人數(shù)據(jù)、世界模型模擬器、仿真合成數(shù)據(jù)一路走到真機(jī)數(shù)據(jù);
另一邊是算法金字塔,圍繞世界模擬、動(dòng)作對齊、經(jīng)驗(yàn)強(qiáng)化搭建具身基礎(chǔ)模型的自我進(jìn)化路徑。
![]()
資本市場也已經(jīng)提前投票。2026年3月至4月,極佳視界在短短一個(gè)月內(nèi)連續(xù)完成兩輪融資,合計(jì)金額約25億元,并躋身國內(nèi)首個(gè)世界模型“百億獨(dú)角獸”
于是,一個(gè)更值得追蹤的問題浮出水面:
當(dāng)100臺機(jī)器人開始進(jìn)入真實(shí)家庭,當(dāng)雙金字塔體系開始吃到長周期、多變量、帶有人類反饋的真機(jī)數(shù)據(jù),當(dāng)25億元融資把研發(fā)、量產(chǎn)與場景落地同時(shí)推上快車道,物理AGI會不會真的迎來自己的臨界點(diǎn)?
務(wù)實(shí)的輪臂機(jī)器人與百臺真機(jī)進(jìn)家
極佳視界聯(lián)合創(chuàng)始人、首席科學(xué)家朱政博士,這一次走向臺前,身上多了一個(gè)新標(biāo)簽:拾光品牌CEO
![]()
作為全場焦點(diǎn)的具身智能C端子品牌,朱政在發(fā)布會上留下了一段近乎產(chǎn)品宣言的定調(diào):
AGI不該只停留在屏幕里。我們不是在講一個(gè)遙遠(yuǎn)的未來故事,而是在把骨子里對物理AGI的信仰,變成真實(shí)的產(chǎn)品。
在這款第一代產(chǎn)品——拾光S1的設(shè)計(jì)哲學(xué)里,能清晰看到這家公司對“真實(shí)家庭場景”極其具體的解構(gòu)。
最具視覺沖擊力的“全人形+雙足”路線,并沒有出現(xiàn)在拾光S1身上。相反,它采用了一種更務(wù)實(shí)的家庭版輪臂構(gòu)型——下半身輪式底盤,上半身人形雙臂。
這是一組帶有鮮明產(chǎn)品觀的取舍。
畢竟在現(xiàn)階段,家庭場景對機(jī)器人的真實(shí)剛需,是穩(wěn)當(dāng)?shù)囟怂⑹帐安途摺⒈鹋K衣籃、把零食遞到孩子手上,而不是在客廳里完成酷炫的跑酷動(dòng)作。
相比之下,輪臂構(gòu)型在穩(wěn)定性、安全性、續(xù)航以及硬性成本上,顯然都更占優(yōu)勢。
面對中國家庭的真實(shí)地板寬度、真實(shí)門洞尺寸以及真實(shí)的預(yù)算曲線,拾光S1展現(xiàn)出了一種極為清醒且務(wù)實(shí)的市場姿態(tài)。
而在務(wù)實(shí)的硬件外殼之下,支撐其運(yùn)轉(zhuǎn)的是極佳視界自研的具身基礎(chǔ)模型(GigaBrain系列)
該模型實(shí)現(xiàn)了從感知、理解到行動(dòng)的完整閉環(huán),能夠自主識別物體與場景、規(guī)劃路徑,并執(zhí)行包含抓取、對齊、折疊、歸類等多步驟的長程任務(wù)
回到硬核的商業(yè)化進(jìn)展上,極佳視界現(xiàn)場宣布:拾光S1已斬獲真實(shí)家庭場景的百臺量產(chǎn)訂單,將率先部署于武漢光谷之寓——一處位于光谷的真實(shí)居民住宅社區(qū)。
![]()
具體的落地節(jié)奏也已經(jīng)排定好:
- 5月31日起:拾光S1真實(shí)家庭場景展示體驗(yàn)空間面向公眾開放;
- 第三季度起:正式開啟百臺規(guī)模化運(yùn)營;
- 屆時(shí):下一代產(chǎn)品拾光S2將同步發(fā)布,并開啟真實(shí)家庭創(chuàng)始版預(yù)定通道。
把“100臺”這個(gè)數(shù)字放進(jìn)全球具身智能的坐標(biāo)系來看,其含金量并不在于數(shù)字本身,而在于“家庭”二字。
縱觀全球,F(xiàn)igure AI挺進(jìn)了寶馬工廠,但其家庭場景仍處于試點(diǎn)階段;1X雖開放過NEO的預(yù)訂,但實(shí)際履約規(guī)模仍停留在數(shù)十臺;Tesla Optimus至今則尚未真正對外部消費(fèi)者開售。
在主流國內(nèi)具身智能玩家里,目前能夠拿出一份可履約家庭訂單的團(tuán)隊(duì),也屈指可數(shù)。
究其原因,進(jìn)工廠和進(jìn)家庭,完全是兩個(gè)數(shù)量級的難度。
工業(yè)工廠是高度結(jié)構(gòu)化的,光線、節(jié)拍、物料位置基本恒定。
而家庭場景則是極度的“非結(jié)構(gòu)化”:今天家具被挪動(dòng)了位置,明天孩子把玩具撒了一地,后天又有客人突然到訪……所有的動(dòng)態(tài)變量都在無限疊加。
這也揭示了當(dāng)前行業(yè)最隱秘的痛點(diǎn)——當(dāng)下具身智能最稀缺的資源,不是算法,也不是單純的算力,而是在真實(shí)家庭里、長周期、多變量、帶有人類反饋(RLHF)的真機(jī)數(shù)據(jù)
這種數(shù)據(jù),在實(shí)驗(yàn)室里造不出來,在自動(dòng)化工廠里也補(bǔ)不出來。
一旦第三季度這百臺機(jī)器人真正跑起來,產(chǎn)生的將是難以被復(fù)制的核心數(shù)據(jù)資產(chǎn):家庭場景下的真實(shí)故障率、用戶偏好分布、更具煙火氣的長尾任務(wù)清單,以及人機(jī)交互的真實(shí)邊界。
這些數(shù)據(jù),將成為GigaBrain后續(xù)模型迭代不可替代的燃料。
值得注意的是,在C端家庭場景高調(diào)破局的同時(shí),極佳視界的B端工業(yè)節(jié)奏也在平行推進(jìn)。
就在發(fā)布會前不久,極佳視界聯(lián)合一汽模具、阿里云,完成了國內(nèi)首個(gè)具身智能機(jī)器人在真實(shí)工業(yè)制造場景的全流程落地
在這場跨界合作中,團(tuán)隊(duì)成功將傳統(tǒng)自動(dòng)化方案長達(dá)數(shù)月的場景適配周期,壓縮到了短短幾周
家用求廣,工業(yè)求深。
左手C端場景的數(shù)據(jù)飛輪,右手B端工業(yè)的標(biāo)桿落地,極佳視界的雙線并行矩陣,至此已初具雛形。
技術(shù)方法論:解構(gòu)物理AGI的“雙金字塔”體系
如果說“百臺部署”回答了具身智能產(chǎn)品何時(shí)落地的破局點(diǎn),那么“雙金字塔”回答的就是另一個(gè)更底層、更核心的終極命題:
物理AGI的Scaling Law,究竟該建在什么樣的基石之上?
在發(fā)布會現(xiàn)場,極佳視界合伙人、研發(fā)副總裁葉云首次完整披露了公司過去三年沉淀的技術(shù)方法論。
![]()
△極佳視界合伙人、研發(fā)副總裁葉云
他直言不諱地指出了當(dāng)前具身智能行業(yè)系統(tǒng)性存在、卻鮮少被徹底攻克的兩大瓶頸:
一是數(shù)據(jù)側(cè)的“既要又要還要”難題。
真機(jī)數(shù)據(jù)精度高但成本高、規(guī)模小;仿真數(shù)據(jù)可擴(kuò)展但存在不可忽視的sim-to-real gap(虛實(shí)遷移鴻溝);互聯(lián)網(wǎng)視頻規(guī)模極大,卻缺乏動(dòng)作監(jiān)督。
任何單一數(shù)據(jù)源,都無法同時(shí)滿足規(guī)模、密度和真實(shí)性。
二是算法側(cè)的“小馬拉大車”困局。
主流VLA(Vision-Language-Action)范式習(xí)慣性將視覺、動(dòng)作token化后塞進(jìn)大語言模型,但這套機(jī)制天然不擅長處理3D空間信息、物理因果邏輯以及連續(xù)動(dòng)作編碼。
針對這兩大痛點(diǎn),極佳視界給出的解法是:將數(shù)據(jù)與算法分別解構(gòu),用結(jié)構(gòu)化的“雙金字塔”體系強(qiáng)行破局。
![]()
數(shù)據(jù)金字塔的核心,在于解決模型“喂什么”的問題。
極佳視界將其從底到頂劃分為5個(gè)層級:
互聯(lián)網(wǎng)視頻數(shù)據(jù)→真人數(shù)據(jù)→世界模型模擬器→仿真合成數(shù)據(jù)→真機(jī)數(shù)據(jù)。
在這套架構(gòu)中,底層管廣度,頂層管精度。
而中間三層,正是工程化空間最大、也是過去整個(gè)行業(yè)最被低估的“腰部力量”。
分層概念在學(xué)術(shù)界討論已兩年有余,真正拉開差距的是全棧工程化的落地能力
極佳視界直接為每一層都掏出了對應(yīng)的商業(yè)化或自研硬核產(chǎn)品:
- 互聯(lián)網(wǎng)視頻層:YouTube、Panda-70M等公開海量數(shù)據(jù)的高效復(fù)用;
- 真人數(shù)據(jù)層:低成本手持?jǐn)?shù)采硬件“U-01”+低成本Ego(第一人稱視角)數(shù)采硬件“E-01”;
- 仿真合成與世界模型層:自研具身世界模型平臺“GigaWorld-0”;
- 真機(jī)數(shù)據(jù)層:家庭版輪臂機(jī)器人“拾光S1”+低成本真機(jī)數(shù)采硬件“Maker M01”。
從數(shù)據(jù)采集、數(shù)據(jù)生成到模型訓(xùn)練,全鏈路100%控在極佳視界自己手里。
![]()
放眼國內(nèi)具身智能賽道,能對五層數(shù)據(jù)做如此系統(tǒng)性、全棧式硬核布局的玩家,目前或許只有極佳視界一家。
一個(gè)剛發(fā)生的硬核例證是:極佳視界與清華大學(xué)合作的研究成果R2RGen,正式被機(jī)器人頂級會議RSS 2026錄用。
該技術(shù)支持機(jī)器人在“僅看一條人類演示”的前提下,就能完成一組任務(wù)的空間泛化,其1條演示的訓(xùn)練效果可直接媲美25條真人演示
這正是數(shù)據(jù)金字塔中,用算法工具實(shí)現(xiàn)“真機(jī)數(shù)據(jù)高倍率放大”的典型降維打擊。
如果說數(shù)據(jù)金字塔是筑基,那么算法金字塔解決的就是“怎么學(xué)”的自驅(qū)路徑。
它由底到頂分為三層:世界模擬→動(dòng)作對齊→經(jīng)驗(yàn)強(qiáng)化
在這條路徑上,極佳視界交出了一份極其罕見的成績單:在全球三大最權(quán)威的具身智能評測中,同時(shí)斬獲第一
1、世界模擬層(GigaWorld-1)
在世界模型權(quán)威評測WorldArena上一舉擊敗谷歌、英偉達(dá)等國際巨頭,登頂全球第一。
它也是全榜單中首個(gè)綜合得分突破60分大關(guān)的具身世界模型。
2、動(dòng)作對齊層(GigaBrain-0系列/GigaWorld-Policy)
極佳視界在該層打出了兩張王牌。
前者在全球規(guī)模最大的真機(jī)評測RoboChallenge中力壓π0.5等頂流模型斬獲第一;
后者則在面向家庭場景的RoboCasa365中,擊敗了NVIDIA GR00T N1.5,成為榜單上首個(gè)登頂的世界動(dòng)作模型(World Action Model)。
3、經(jīng)驗(yàn)強(qiáng)化層(GigaBrain-0.5M*)
通過“世界模型+強(qiáng)化學(xué)習(xí)”的雙向加持,真正跑通了具身基座模型的自我進(jìn)化(Self-evolution)。
世界生成、真機(jī)操作、家庭場景泛化這三種本質(zhì)不同的能力范式,由同一支團(tuán)隊(duì)在同一時(shí)間節(jié)點(diǎn)集中突破,這在行業(yè)內(nèi)極具震撼力。
![]()
至此,極佳視界的“雙金字塔”完成了它最具里程碑意義的閉環(huán):
它將物理AGI的Scaling Law路徑,從紙面上的宏大概念,變成了一套可對照、可復(fù)現(xiàn)、可被量化評測的系統(tǒng)化落地方案
物理AGI的“GPT-3時(shí)刻”何時(shí)到來?
在發(fā)布會現(xiàn)場,極佳視界還扔出了下一代硬件的重磅預(yù)告——拾光S2將于2026年第三季度正式發(fā)布。
這一次,極佳視界沒有單純卷參數(shù),而是將準(zhǔn)心扣在了“真實(shí)家庭可用性”這三個(gè)字上。
![]()
拾光S2三大核心指標(biāo)的升級路徑,清晰可見:
- 空間瘦身:底盤體積直降60%,極限貼合中國家庭略顯狹窄的過道與玄關(guān);
- 續(xù)航躍升:電池續(xù)航暴增70%,并全面支持熱換電以確保全天候待命;
- 縱向延展:操作范圍擴(kuò)大40%,最高可執(zhí)行2.2米高度的縱向家務(wù)任務(wù)。
對于這次升級,極佳視界聯(lián)合創(chuàng)始人朱政在現(xiàn)場給出了這樣的定義:
S2的核心,不是某個(gè)參數(shù)變得更漂亮,而是整機(jī)開始真正接近真實(shí)家庭所需要的“可用性”。
據(jù)悉,真實(shí)家庭創(chuàng)始版預(yù)定通道,也將在發(fā)布時(shí)同步開啟。
相比于硬件的漸進(jìn)式改良,更具行業(yè)風(fēng)向標(biāo)意義的,是極佳視界首次公開的基礎(chǔ)模型12個(gè)月路線圖
這張“明牌”的時(shí)間表,直接將具身智能的智能化進(jìn)程進(jìn)行了量化:
- GigaBrain-1:2026年Q3發(fā)布,據(jù)稱是全球首個(gè)基于“雙金字塔”體系打造的物理AGI基礎(chǔ)模型;
- GigaBrain-2:進(jìn)一步拉滿Scaling Law的加速器;
- GigaBrain-3:基于1000萬小時(shí)視頻數(shù)據(jù)+100萬小時(shí)世界-動(dòng)作數(shù)據(jù)訓(xùn)練,直接劍指物理AGI的“GPT-3時(shí)刻”
![]()
在大模型發(fā)展史上,GPT-3的里程碑意義并不在于模型結(jié)構(gòu)本身,而在于它是Scaling Law首次顯現(xiàn)“涌現(xiàn)能力”的臨界點(diǎn)。
當(dāng)數(shù)據(jù)規(guī)模與算力跨過那個(gè)神秘的閾值,物理世界的認(rèn)知就會從量變產(chǎn)生質(zhì)變。
物理AGI的“GPT-3時(shí)刻”在理論上同構(gòu)——
數(shù)據(jù)規(guī)模(1000萬+100萬小時(shí))與算法范式(雙金字塔)在臨界點(diǎn)交匯,物理智能體將展現(xiàn)出真正意義上的通用性
這不是指在實(shí)驗(yàn)室預(yù)設(shè)的場景下機(jī)械地干十種家務(wù),而是意味著它能夠“空降”到任何一戶真實(shí)家庭,能應(yīng)對所有突發(fā)的意外,并在每一次環(huán)境反饋中完成自我進(jìn)化。
過去兩年,行業(yè)對于“物理AGI何時(shí)到來”的追問,大多得到了“五年內(nèi)”、“指日可待”等模糊的回應(yīng)。
極佳視界這次直接掀掉底牌,把宏大命題拆解為兩個(gè)確定性的交卷時(shí)間:需要什么樣的體系(雙金字塔),以及什么時(shí)候到達(dá)臨界點(diǎn)(12個(gè)月)
這是一個(gè)可以被全行業(yè)公開檢驗(yàn)的答案。
物理AI“夢之隊(duì)”集結(jié)
除了技術(shù),極佳視界更亮眼的莫過于其核心團(tuán)隊(duì):
創(chuàng)始人兼CEO黃冠,清華大學(xué)自動(dòng)化系創(chuàng)新領(lǐng)軍工程博士。
曾擔(dān)任地平線機(jī)器人視覺感知技術(shù)負(fù)責(zé)人、鑒智機(jī)器人合伙人&算法副總裁,并擁有微軟亞洲研究院、三星中國研究院等頂尖研究機(jī)構(gòu)工作經(jīng)歷。
他完整經(jīng)歷了過去十年物理AI的技術(shù)和產(chǎn)業(yè)發(fā)展歷程,多次帶領(lǐng)團(tuán)隊(duì)獲得全球權(quán)威AI比賽世界冠軍,并發(fā)布多個(gè)全球知名AI成果。
聯(lián)合創(chuàng)始人兼首席科學(xué)家朱政,智源青年學(xué)者,發(fā)表頂級論文70余篇,引用近2萬次。
多篇著作影響力巨大,連續(xù)4年入選全球前2%頂尖科學(xué)家榜單,多次獲得吳文俊自然科學(xué)一等獎(jiǎng)、最佳學(xué)生論文獎(jiǎng)、CCF杰出論文獎(jiǎng)等榮譽(yù),也是多個(gè)頂會領(lǐng)域主席、多項(xiàng)競賽冠軍。
![]()
聯(lián)合創(chuàng)始人孫韶言,曾擔(dān)任阿里云總監(jiān),地平線數(shù)據(jù)閉環(huán)產(chǎn)品線總經(jīng)理,在物理世界超大規(guī)模數(shù)據(jù)閉環(huán)產(chǎn)品和架構(gòu)方面擁有行業(yè)領(lǐng)先的經(jīng)驗(yàn)。
他主導(dǎo)了業(yè)內(nèi)首個(gè)智能駕駛數(shù)據(jù)閉環(huán)系統(tǒng)的落地,有效提升了數(shù)據(jù)的處理效率,為智能駕駛技術(shù)的發(fā)展提供了重要的基礎(chǔ)設(shè)施支持。
合伙人兼工程副總裁毛繼明,擁有超過16年的仿真/工程/數(shù)據(jù)/分布式架構(gòu)方向的經(jīng)驗(yàn)。
曾擔(dān)任百度Apollo仿真和工程負(fù)責(zé)人,以及曾擔(dān)任百度、贏徹等T10級別架構(gòu)師,主導(dǎo)多個(gè)自動(dòng)駕駛與世界模型核心項(xiàng)目的技術(shù)開發(fā)與落地。在高質(zhì)量數(shù)據(jù)生成、端到端自動(dòng)駕駛架構(gòu)設(shè)計(jì)以及分布式系統(tǒng)優(yōu)化領(lǐng)域有著深厚的積累。
可以說,這支團(tuán)隊(duì)完整經(jīng)歷了CV、自動(dòng)駕駛、具身基模、世界模型等物理AI過去十年的發(fā)展歷程,并在每個(gè)階段都做出了行業(yè)領(lǐng)先的世界級成果。
當(dāng)他們聚集在一起,就共同造就了這支始終引領(lǐng)具身世界模型技術(shù)演進(jìn)的“夢之隊(duì)”。
資本側(cè)給出的反饋同樣明確。
在2026年3月至4月,短短一個(gè)月內(nèi),極佳視界連續(xù)完成兩輪融資,合計(jì)金額高達(dá)約25億元,一舉躋身國內(nèi)首個(gè)世界模型“百億獨(dú)角獸”。
據(jù)說,其背后的投資方矩陣,覆蓋國內(nèi)最具代表性的頂尖產(chǎn)業(yè)資本(華為哈勃就是其中之一)、頭部財(cái)務(wù)機(jī)構(gòu)與重磅國資平臺。
三個(gè)懸而未決的問題
事實(shí)上,極佳視界給出了一套將算法+數(shù)據(jù)+本體+場景+商業(yè)+時(shí)間表全棧打通的物理AGI閉環(huán)路徑。
往前看,三項(xiàng)全球權(quán)威評測冠軍證明了算法架構(gòu)的優(yōu)越性;
往下看,“百臺進(jìn)社區(qū)”印證了工程化的可靠執(zhí)行力;
往未來看,三代基礎(chǔ)模型路線圖則給出了明確的航向。
站在當(dāng)前節(jié)點(diǎn),未來12個(gè)月內(nèi),至少有三件事值得整個(gè)科技界持續(xù)追蹤:
第一,百臺家庭部署能否真正跑出有效數(shù)據(jù)閉環(huán)。
家庭環(huán)境下機(jī)器人能持續(xù)工作多久、故障率與人工介入頻次、用戶偏好如何回流到模型,這是物理智能領(lǐng)域目前最稀缺的資產(chǎn)積累。
第二,2026年Q3的GigaBrain-1是否能如期發(fā)布,并在能力上對得起“雙金字塔”體系所許諾的范式優(yōu)勢。
第三,GigaBrain-3是否能在12個(gè)月后真正觸達(dá)“GPT-3時(shí)刻”
或許這是物理AGI賽道目前最具爭議、也最具兌現(xiàn)價(jià)值的判斷。
正如朱政在發(fā)布會尾聲留下的那句話:
物理AGI服務(wù)每一個(gè)人的時(shí)代,會在一戶一戶真實(shí)家庭中逐漸發(fā)生。
大幕已經(jīng)拉開,這個(gè)預(yù)言會不會變成現(xiàn)實(shí),我們只需要再等12個(gè)月。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.