最近,硅谷機(jī)器人公司 Figure AI 的一場(chǎng)分揀直播,把人形機(jī)器人重新推到科技圈聚光燈下。
直播畫(huà)面里,一臺(tái)人形機(jī)器人站在傳送帶前,像倉(cāng)庫(kù)工人一樣完成包裹分揀:識(shí)別包裹條碼、抓取、翻轉(zhuǎn)、調(diào)整方向,再放到對(duì)應(yīng)位置。相比此前人形機(jī)器人跳舞、端咖啡、搬箱子,這一次 Figure AI 選擇了一個(gè)更接近真實(shí)商業(yè)化的任務(wù)——物流分揀。
![]()
據(jù)外媒報(bào)道,F(xiàn)igure AI展示的是其F.03人形機(jī)器人,背后系統(tǒng)為 Helix-02。Figure AI CEO Brett Adcock對(duì)外表示,機(jī)器人在直播中實(shí)現(xiàn)自主運(yùn)行,沒(méi)有人類(lèi)遙操作參與。直播畫(huà)面顯示,機(jī)器人能夠連續(xù)數(shù)小時(shí)執(zhí)行分揀任務(wù),并接近約 3 秒處理一件包裹的人類(lèi)工作節(jié)奏。這場(chǎng)直播迅速獲得大量觀看,也引發(fā)外界對(duì)人形機(jī)器人商業(yè)化進(jìn)度的討論。
Figure AI 之所以引發(fā)關(guān)注,并不只是因?yàn)闄C(jī)器人的分揀能力,而是因?yàn)榉謷@個(gè)任務(wù)本身代表著具身智能進(jìn)入現(xiàn)實(shí)產(chǎn)業(yè)的一道門(mén)檻。
在倉(cāng)儲(chǔ)、物流、制造業(yè)等場(chǎng)景中,大量工作都可以被拆解為識(shí)別、抓取、搬運(yùn)、放置、復(fù)核等動(dòng)作。過(guò)去,工業(yè)機(jī)器人更擅長(zhǎng)在固定位置、固定軌跡、固定工件上完成重復(fù)動(dòng)作;而具身智能機(jī)器人要解決的是更復(fù)雜的問(wèn)題:物體形狀不固定,位置不固定,任務(wù)指令可能變化,機(jī)器人不僅要?jiǎng)悠饋?lái),還要理解環(huán)境、判斷目標(biāo)、規(guī)劃動(dòng)作,并在真實(shí)物理世界里穩(wěn)定執(zhí)行。
類(lèi)似的公司,并不只在美國(guó)出現(xiàn)。在中國(guó),科大訊飛體系內(nèi)也有一家正在做類(lèi)似方向的機(jī)器人公司——聆動(dòng)通用。
聆動(dòng)通用成立于2024年12月,總部位于合肥,是科大訊飛生態(tài)內(nèi)聚焦工業(yè)具身智能的硬科技企業(yè)。公開(kāi)資料顯示,聆動(dòng)通用定位為“訊飛系”具身智能通用機(jī)器人公司,聚焦具身大模型和通用機(jī)器人研發(fā),主攻B端產(chǎn)業(yè)場(chǎng)景。
從應(yīng)用場(chǎng)景看,F(xiàn)igure Al 此次展示的包裹分揀,與聆動(dòng)通用切入的揀選、面單識(shí)別、工業(yè)操作等方向存在明顯交集。兩者都瞄準(zhǔn)了具身智能商業(yè)化最現(xiàn)實(shí)的一類(lèi)場(chǎng)景:讓機(jī)器人在真實(shí)產(chǎn)業(yè)現(xiàn)場(chǎng)替代或輔助人類(lèi)完成重復(fù)性、高頻次、標(biāo)準(zhǔn)化程度較高的體力勞動(dòng)。
據(jù)公開(kāi)報(bào)道,聆動(dòng)通用成立后已完成多輪融資。2025 年 8 月,公司完成數(shù)億元人民幣天使輪融資,訊飛創(chuàng)投持續(xù)戰(zhàn)略加碼,元禾璞華、優(yōu)勢(shì)資本、盈科投資、天智投資、合肥高投等參與投資。2026 年 4 月,聆動(dòng)通用又宣布完成數(shù)億元 Pre-A 輪融資,投資方包括華義創(chuàng)投、訊飛創(chuàng)投、泰達(dá)科投、博眾精工產(chǎn)投等。
團(tuán)隊(duì)方面,聆動(dòng)通用創(chuàng)始人兼 CEO 季超為中國(guó)科學(xué)技術(shù)大學(xué)博士,長(zhǎng)期從事機(jī)器人感知、交互、運(yùn)動(dòng)控制和具身智能相關(guān)技術(shù)研發(fā)。公開(kāi)資料顯示,季超畢業(yè)后加入科大訊飛,參與過(guò) AI 智能硬件、機(jī)器人和具身智能關(guān)鍵技術(shù)研發(fā)及產(chǎn)業(yè)化工作。
在技術(shù)路線(xiàn)上,聆動(dòng)通用提出的是“大腦—小腦—本體”全鏈路自主可控架構(gòu)。其中,“大腦”對(duì)應(yīng)機(jī)器人的認(rèn)知、理解和任務(wù)規(guī)劃能力;“小腦”對(duì)應(yīng)運(yùn)動(dòng)控制、技能執(zhí)行和動(dòng)作穩(wěn)定性;“本體”則是機(jī)器人完成物理交互的硬件基礎(chǔ)。
聆動(dòng)通用公開(kāi)介紹中提到,公司聚焦打造高泛化性的具身大模型和通用魯棒機(jī)器人本體,推出了 iFlyBot-VLM 視覺(jué)語(yǔ)言基座大模型和 iFlyBot-VLA 視覺(jué)-語(yǔ)言-動(dòng)作操作大模型,試圖解決具身智能在真實(shí)場(chǎng)景中的泛化和落地問(wèn)題。
![]()
VLA推理翻面單技能
![]()
一臺(tái)機(jī)器人可串接多任務(wù)作業(yè)
中國(guó)擁有龐大的制造業(yè)、倉(cāng)儲(chǔ)物流、商超零售和工業(yè)自動(dòng)化需求。相比家庭服務(wù)機(jī)器人,B 端產(chǎn)業(yè)場(chǎng)景需求更明確,付費(fèi)能力更強(qiáng),ROI 也更容易計(jì)算。分揀、揀選、搬運(yùn)、上下料、質(zhì)檢、補(bǔ)貨等任務(wù),都可能成為具身智能機(jī)器人的早期落地場(chǎng)景。
從技術(shù)演進(jìn)路徑來(lái)看,科大訊飛的 AI 能力布局呈現(xiàn)清晰的遞進(jìn)邏輯:從核心的大語(yǔ)言模型起步,先完成文本理解、知識(shí)推理與自然交互的基礎(chǔ)能力構(gòu)建;再升級(jí)為多模態(tài)大模型,打通視覺(jué)、聽(tīng)覺(jué)、語(yǔ)言等多維度信息感知與融合,讓 AI 具備 “看懂、聽(tīng)懂、理解” 復(fù)雜場(chǎng)景的能力;最終延伸至具身智能模型,把虛擬世界的 AI 認(rèn)知能力,落地為物理世界的感知、決策與動(dòng)作執(zhí)行能力。
而聆動(dòng)通用,正是科大訊飛將這套完整 AI 技術(shù)體系,從數(shù)字世界走向?qū)嶓w產(chǎn)業(yè)、從軟件智能走向軟硬件一體的關(guān)鍵載體,也是中國(guó)具身智能追趕全球前沿、實(shí)現(xiàn)產(chǎn)業(yè)落地的重要力量。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.