具身智能的落地,正在從實(shí)驗(yàn)室走向最真實(shí)、最繁忙的物理世界。
而元節(jié)智能(AtomBite.AI)選擇了一個(gè)看起來(lái)并不性感、但足夠真實(shí)的場(chǎng)景:餐飲后廚。
36氪獲悉,具身智能公司元節(jié)智能近日完成千萬(wàn)級(jí)種子輪融資,由英諾科創(chuàng)基金領(lǐng)投,水木清華校友種子基金、知名投資人個(gè)人跟投。資金將主要用于餐飲場(chǎng)景具身世界模型研發(fā)及核心產(chǎn)品落地。
元節(jié)核心團(tuán)隊(duì)在成立公司前有過(guò)較長(zhǎng)時(shí)期的探索和孵化,此次融資標(biāo)志著項(xiàng)目初步驗(yàn)證可行性,并已拿到國(guó)內(nèi)外多家頭部公司的產(chǎn)品合作部署意向。
元節(jié)智能的創(chuàng)始團(tuán)隊(duì)帶有鮮明的“美團(tuán)基因”。
創(chuàng)始人兼CEO王棟博士曾任美團(tuán)外賣(mài)事業(yè)部技術(shù)負(fù)責(zé)人,管理千人產(chǎn)研團(tuán)隊(duì),主導(dǎo)構(gòu)建支撐日均數(shù)千萬(wàn)訂單的外賣(mài)算法、數(shù)據(jù)與系統(tǒng)架構(gòu);聯(lián)合創(chuàng)始人李滔曾執(zhí)掌美團(tuán)外賣(mài)算法與數(shù)據(jù)體系,是少數(shù)真正跑通過(guò)“全鏈路數(shù)據(jù)算法驅(qū)動(dòng)”的技術(shù)負(fù)責(zé)人;聯(lián)合創(chuàng)始人李浩哲則是連續(xù)創(chuàng)業(yè)者,具備多年全球化商業(yè)落地經(jīng)驗(yàn)。
過(guò)去幾年,餐飲數(shù)字化已經(jīng)被SaaS、點(diǎn)餐小程序、配送調(diào)度系統(tǒng)改造了一輪又一輪,但當(dāng)全球外賣(mài)訂單持續(xù)攀升,一個(gè)長(zhǎng)期被忽視的問(wèn)題開(kāi)始變得越來(lái)越突出:從商家出餐到騎手取餐之間,仍然存在大量高度依賴人工的物理操作環(huán)節(jié)。
比如打包、封簽、分揀、接駁、配送。
這些流程看似瑣碎,卻直接影響整個(gè)履約效率。錯(cuò)單、漏單、撒漏帶來(lái)的損耗,會(huì)同時(shí)傳導(dǎo)至用戶、商家、騎手與平臺(tái)四端。與此同時(shí),全球餐飲行業(yè)還普遍面臨結(jié)構(gòu)性用工問(wèn)題:北美快餐行業(yè)時(shí)薪持續(xù)上漲,國(guó)內(nèi)餐飲門(mén)店則長(zhǎng)期存在招工難、流動(dòng)率高的問(wèn)題。
離開(kāi)美團(tuán)之后,王棟曾在北美與新加坡進(jìn)行了持續(xù)數(shù)月的市場(chǎng)考察,深入走訪大量餐飲商家與外賣(mài)平臺(tái)。他最終形成了一個(gè)明確判斷:餐飲后廚,可能是具身智能最具確定性的商業(yè)落地方向之一。
原因在于,這個(gè)場(chǎng)景同時(shí)具備幾個(gè)關(guān)鍵特征。
首先,它是全球共通需求。無(wú)論中國(guó)、北美還是東南亞,餐飲行業(yè)都面臨人力成本上升與履約效率問(wèn)題。
其次,它的ROI足夠清晰。只要能夠降低錯(cuò)單率、減少人工、提升出餐效率,商家就愿意為此付費(fèi)。
更重要的是,相比家庭、養(yǎng)老等強(qiáng)調(diào)情感交互的場(chǎng)景,餐飲屬于專(zhuān)業(yè)服務(wù)領(lǐng)域,決策鏈條更短,中小商家合作意愿更強(qiáng)。
在接受36氪采訪時(shí),王棟表示,服務(wù)業(yè)本身占據(jù)全球GDP的巨大比例。如果能夠在餐飲后廚這個(gè)高頻場(chǎng)景中建立起真正可運(yùn)行的具身方案,實(shí)現(xiàn)從模型到應(yīng)用的系統(tǒng)性落地閉環(huán),本身就價(jià)值巨大,并且也具備未來(lái)再向家庭廚房等更復(fù)雜的場(chǎng)景延伸的可能。
![]()
(圖源/企業(yè))
相比不少公司優(yōu)先做“通用具身世界模型”,元節(jié)智能更傾向于從真實(shí)場(chǎng)景中持續(xù)學(xué)習(xí)以逐步建立模型能力。
王棟表示,“移動(dòng)能力(Locomotion)經(jīng)過(guò)七八年發(fā)展,其實(shí)已經(jīng)基本解決了。現(xiàn)在行業(yè)真正的焦點(diǎn),開(kāi)始轉(zhuǎn)向精細(xì)操作。雖然靈巧手距離真正成熟還有距離,但二指、三指夾爪已經(jīng)出現(xiàn)大量成熟的工程化方案,可以支撐部分標(biāo)準(zhǔn)化任務(wù)落地。”
在這樣的判斷下,元節(jié)智能沒(méi)有把重點(diǎn)放在重新發(fā)明機(jī)器人硬件,而是要做一套面向餐飲場(chǎng)景的“世界動(dòng)作模型(World Action Model,WAM)”。
在王棟看來(lái),VLA(Vision-Language-Action)路線過(guò)度依賴語(yǔ)言模塊進(jìn)行高層規(guī)劃,但對(duì)視覺(jué)表征不足,而真實(shí)世界里的動(dòng)作控制,本質(zhì)上并不依賴語(yǔ)言。“人類(lèi)真正的動(dòng)作控制路徑,其實(shí)沒(méi)有那么強(qiáng)依賴language。更核心的問(wèn)題,是視覺(jué)理解、物理理解,以及動(dòng)作如何與真實(shí)世界建立映射。”
基于這一判斷,元節(jié)智能在模型層面更強(qiáng)調(diào)探索融合視覺(jué)(Vision)與觸覺(jué)(Touch)的“VT-WAM”(視覺(jué)-觸覺(jué)世界動(dòng)作模型)。王棟解釋道:“視覺(jué)看得見(jiàn)物體,卻看不見(jiàn)接觸;觸覺(jué)看不見(jiàn)全局,卻看得見(jiàn)成敗。視覺(jué)ground的是世界的幾何側(cè)面,觸覺(jué)ground的是世界的物理側(cè)面。VT-WAM再把這兩類(lèi)信息通過(guò)隱空間綜合進(jìn)一個(gè)能預(yù)判接觸后果的‘世界-動(dòng)作模型’。”
世界模型不僅需要視覺(jué)感知能力,更重要的是理解真實(shí)物理世界中的規(guī)律與因果關(guān)系。他舉例說(shuō),一個(gè)飲料杯是否裝水、裝得滿不滿、溫度是冷是熱,都會(huì)影響機(jī)器人抓取時(shí)的摩擦力、重心變化與操作穩(wěn)定性。
元節(jié)智能希望通過(guò)視覺(jué)、觸覺(jué)等多傳感器協(xié)同感知物體狀態(tài),并在模型中嵌入對(duì)液體晃動(dòng)、重心變化等物理屬性的因果理解,讓機(jī)器人的動(dòng)作不只是基于數(shù)據(jù)擬合,而是真正符合現(xiàn)實(shí)世界的物理規(guī)律,從而提升抓取與操作的穩(wěn)定性和精細(xì)度。
從技術(shù)架構(gòu)來(lái)看,元節(jié)的系統(tǒng)大致分為三層:最上層是具身世界模型,用于形成對(duì)后廚環(huán)境的認(rèn)知,并完成決策與動(dòng)作規(guī)劃;中層是任務(wù)編排與調(diào)度引擎,將認(rèn)知結(jié)果轉(zhuǎn)化為具體執(zhí)行計(jì)劃,并統(tǒng)一調(diào)度不同設(shè)備;底層則是自研核心部件與通用硬件本體的融合,確保系統(tǒng)能夠在真實(shí)后廚長(zhǎng)期穩(wěn)定運(yùn)行。
這套架構(gòu)背后的核心邏輯是:不是先造一個(gè)通用機(jī)器人,再去尋找應(yīng)用場(chǎng)景,而是在一個(gè)足夠高頻、足夠痛的場(chǎng)景里持續(xù)收集真實(shí)交互數(shù)據(jù),反過(guò)來(lái)喂養(yǎng)世界模型,讓模型在物理世界中越來(lái)越“聰明”。
餐飲后廚每天都在重復(fù)大量高頻操作——打包、分揀、搬運(yùn)、烹飪、接駁——這些動(dòng)作天然能夠形成海量、多樣化的真實(shí)世界數(shù)據(jù),而這類(lèi)數(shù)據(jù)很難單純依靠仿真環(huán)境生成。
![]()
(圖源/企業(yè))
具體落地路徑上,元節(jié)智能目前選擇從“外賣(mài)打包與接駁”切入。這是整個(gè)履約鏈路中出錯(cuò)率最高、標(biāo)準(zhǔn)化程度相對(duì)較高、同時(shí)又最容易量化價(jià)值的環(huán)節(jié)。
“打包環(huán)節(jié)的任務(wù)范圍清晰,場(chǎng)景可控,我們的路徑是以商業(yè)價(jià)值為依據(jù),先聚焦提升抓取精準(zhǔn)度,做到可用可靠。”王棟表示,“站在商業(yè)視角,商家并不在意你的機(jī)器人像不像人,會(huì)不會(huì)跳舞,商家更在乎你到底能幫我干什么活。”
目前,元節(jié)的方案是將高頻、標(biāo)準(zhǔn)化動(dòng)作交給端側(cè)輕量化小模型執(zhí)行,例如套餐裝盒、封簽等動(dòng)作,以降低延遲與網(wǎng)絡(luò)依賴;而云端大模型則主要用于處理異常情況,例如物料缺失、異物干擾等復(fù)雜場(chǎng)景,并通過(guò)KDS系統(tǒng)聯(lián)動(dòng)后廚人工補(bǔ)位。
打包環(huán)節(jié)模型預(yù)計(jì)會(huì)在2026年內(nèi)進(jìn)入真實(shí)商家后廚進(jìn)行規(guī)模化部署。
在團(tuán)隊(duì)的設(shè)想中,未來(lái)模型能力會(huì)從打包這一單點(diǎn)環(huán)節(jié)切入,繼續(xù)向更復(fù)雜的后廚操作延伸,包括分揀、配送接駁、烹飪協(xié)同,甚至逐步進(jìn)入更廣泛的服務(wù)業(yè)場(chǎng)景。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.