![]()
5 月 20 日,具身智能初創(chuàng)公司貝塔無(wú)限(Beta Infinity)宣布完成種子+ 輪融資。本輪由世紀(jì)華通參與的盛趣泰和基金與和利資本聯(lián)合領(lǐng)投,毅達(dá)資本、南山戰(zhàn)新投等機(jī)構(gòu)跟投。這是該公司成立后完成的第二輪融資,累計(jì)融資金額達(dá)數(shù)億元,資金將主要用于核心技術(shù)研發(fā)及產(chǎn)品試制等。
創(chuàng)辦這家公司的是劉武龍和陶帥,他們專注于打造消費(fèi)級(jí)具身智能系統(tǒng)與終端產(chǎn)品。
聯(lián)合創(chuàng)始人兼 CEO 劉武龍畢業(yè)于清華大學(xué)電子系。他曾任職于華為,歷任大模型工程團(tuán)隊(duì)負(fù)責(zé)人、強(qiáng)化學(xué)習(xí)首席科學(xué)家,并成為華為最年輕的 AI 研究所所長(zhǎng)。任職期間,劉武龍主導(dǎo)孵化了華為智能駕駛業(yè)務(wù),是首個(gè)不依賴高精地圖的量產(chǎn)版本 ADS 2.0(高階智能駕駛系統(tǒng))的核心操刀者,并從 0 到 1 打造了昇騰萬(wàn)卡集群訓(xùn)推系統(tǒng),主持昇騰萬(wàn)卡集群調(diào)優(yōu)。具備智能駕駛與大模型雙向技術(shù)研發(fā)及產(chǎn)品落地經(jīng)驗(yàn)。
聯(lián)合創(chuàng)始人兼 CTO 陶帥同樣來(lái)自清華大學(xué)電子系。他曾擔(dān)任字節(jié)負(fù)責(zé)搜索、網(wǎng)盟商業(yè)化 AI 算法和工程總監(jiān)。在字節(jié)任職期間,他帶領(lǐng)百人 AI 團(tuán)隊(duì),從 0 到 1 打造出年?duì)I收數(shù)百億的“千人千面”復(fù)雜 AI 系統(tǒng),在 C 端個(gè)性化技術(shù)、大模型算法等領(lǐng)域積淀深厚。
2025 年中,兩人決定創(chuàng)業(yè)。他們密集考察了多個(gè)應(yīng)用場(chǎng)景,于同年年底確立業(yè)務(wù)方向,并于 2026 年 3 月正式開(kāi)始運(yùn)營(yíng),團(tuán)隊(duì)核心成員主要來(lái)自華為、字節(jié)跳動(dòng)、智元、大疆等企業(yè)。
目前,該公司正在研發(fā)首批消費(fèi)級(jí)具身智能產(chǎn)品,先鋒體驗(yàn)版計(jì)劃年內(nèi)亮相;同時(shí),其已與多家上下游產(chǎn)業(yè)頭部企業(yè)達(dá)成深度戰(zhàn)略合作。
在這次對(duì)話中,我們聊了聊為什么他們選擇切入家庭場(chǎng)景的商業(yè)邏輯,詳細(xì)拆解了其致力于打造的“人機(jī)共融”硬件形態(tài)背后的硬核技術(shù)底座。
以下是對(duì)話實(shí)錄,為方便閱讀,做了不改變?cè)獾木庉嫞?/p>
DeepTech:調(diào)研了很多場(chǎng)景,為什么選擇切入消費(fèi)級(jí)具身智能?
陶帥:在深度調(diào)研了 3C 電子加工、汽車裝配、養(yǎng)殖場(chǎng)等 B 端場(chǎng)景后,我們得出兩個(gè)核心判斷。
第一,大模型驅(qū)動(dòng)的具身智能,最適配的是消費(fèi)級(jí)場(chǎng)景。工業(yè)流水線對(duì)機(jī)器人的核心要求是精準(zhǔn)度和節(jié)拍,更適合用傳統(tǒng)工業(yè)視覺(jué)和機(jī)械臂做小范圍泛化;而大模型的優(yōu)勢(shì)在于泛化能力和開(kāi)放性交互,這與消費(fèi)級(jí)市場(chǎng)的需求高度契合。
第二,B 端場(chǎng)景落地難度高,且對(duì)通用具身智能的演進(jìn)幫助有限。工業(yè)數(shù)據(jù)高度定制化,難以形成規(guī)模化數(shù)據(jù)飛輪。過(guò)去兩年,雖然市場(chǎng)上有不少訂單,但真正在產(chǎn)線上實(shí)現(xiàn) ROI(投資回報(bào)率)大于 1 且完全跑通的案例尚未出現(xiàn)。
相比之下,消費(fèi)級(jí)市場(chǎng)是藍(lán)海,其需求與大模型技術(shù)的成熟度曲線高度匹配,也與我們的技術(shù)棧契合。
DeepTech:你們希望打造一款怎樣的機(jī)器人?今年就會(huì)有機(jī)器人的 Demo 亮相?
陶帥:我們專注于消費(fèi)級(jí)市場(chǎng),核心落地場(chǎng)景是家庭,希望打造一款面向“人機(jī)共融”場(chǎng)景的機(jī)器人伙伴,具備高泛化能力和開(kāi)放性的任務(wù)編排能力。
在硬件層面,機(jī)器人必須具有消費(fèi)級(jí)的親和力與靈動(dòng)性,摒棄工業(yè) AGV 式的底盤和僵硬形態(tài),將家庭通行性、人機(jī)適配性和安全性放在首位。
在智能層面,我們賦予機(jī)器人兩項(xiàng)核心能力:第一,全時(shí)空多模態(tài)記憶系統(tǒng),提升機(jī)器人個(gè)性化和長(zhǎng)程復(fù)雜任務(wù)的執(zhí)行能力。這是我們從第一天起就確立的消費(fèi)級(jí)具身智能必修課,能復(fù)用我們?cè)诰€上“千人千面”復(fù)雜推薦系統(tǒng)中積累的經(jīng)驗(yàn);第二,環(huán)境自演進(jìn)能力。具體包括兩方面:一是部署態(tài)的數(shù)據(jù)飛輪,依靠真實(shí)場(chǎng)景中的持續(xù)數(shù)據(jù)驅(qū)動(dòng)實(shí)現(xiàn)進(jìn)化,而非僅靠前置采集;二是強(qiáng)化學(xué)習(xí),是環(huán)境自演進(jìn)的關(guān)鍵技術(shù)基座。
DeepTech:你們近期在招聘服裝設(shè)計(jì)和柔性皮膚設(shè)計(jì)的實(shí)習(xí)生。這是否意味著你們的機(jī)器人在形態(tài)上會(huì)是一款能夠高度融入家庭環(huán)境的產(chǎn)品?
陶帥:是的。既然明確面向消費(fèi)級(jí)市場(chǎng),主打“家庭伙伴”的定位,機(jī)器人在形態(tài)上就必須具備親和力和安全性。一方面,通過(guò)頂尖的工業(yè)設(shè)計(jì)和柔性防護(hù)材料優(yōu)化人機(jī)交互體驗(yàn);另一方面,團(tuán)隊(duì)中的工業(yè)設(shè)計(jì)師也在外形細(xì)節(jié)上投入了大量精力。
除了外觀親和力,我們還對(duì)標(biāo)消費(fèi)電子的“極致堆疊”、性能與高可靠性。目前市面上很多機(jī)器人產(chǎn)品在本體上仍停留在初步可用的階段。而我們追求的是:既要有充滿溫度的人機(jī)交互,又要實(shí)現(xiàn)消費(fèi)電子級(jí)別的硬件極致堆疊,同時(shí)兼顧具身智能本身的實(shí)用性與科技感。
DeepTech:當(dāng)機(jī)器人真正落地到家庭場(chǎng)景時(shí),你們會(huì)先讓它做哪些具體的工作?
陶帥:這是一個(gè)逐步演進(jìn)的過(guò)程,主要圍繞三大核心能力展開(kāi):
第一,構(gòu)建個(gè)性化多模態(tài)交互底座。覆蓋語(yǔ)音、肢體姿態(tài)乃至個(gè)性化移動(dòng)方式,這是機(jī)器人在家庭中最基礎(chǔ)的立足能力。
第二,操作能力的自演進(jìn)與逐步解鎖。初期聚焦簡(jiǎn)單物品收納、抓取等任務(wù),后續(xù)從平面操作升級(jí)到立體空間,再攻克柔性物體。產(chǎn)品初期的操作能力上我們判斷,想一步到位解決通用家務(wù),做到消費(fèi)級(jí)產(chǎn)品要求短期不現(xiàn)實(shí),關(guān)鍵在于設(shè)備入戶后通過(guò) OTA 和真實(shí)場(chǎng)景下的自演進(jìn)機(jī)制持續(xù)提升。
第三,基于 BetaAgenticOS 打造高階技能生態(tài)。結(jié)合家庭場(chǎng)景調(diào)研與用戶付費(fèi)意愿,未來(lái)開(kāi)發(fā)者可在該系統(tǒng)上開(kāi)發(fā)豐富的 Skill 應(yīng)用,形成系統(tǒng)+應(yīng)用的生態(tài)模式。
*OTA 意味著機(jī)器人進(jìn)入家庭后,可以像手機(jī)系統(tǒng)更新一樣,通過(guò)云端遠(yuǎn)程獲取新的算法模型、技能包或性能優(yōu)化,從而實(shí)現(xiàn)持續(xù)進(jìn)化。
DeepTech:讓機(jī)器人具備多模態(tài)交互能力,能和人類互動(dòng),那會(huì)接入諸如 DeepSeek 這樣的模型嗎?
陶帥:僅僅接入 DeepSeek 這類模型,無(wú)法滿足我們對(duì)消費(fèi)級(jí)具身智能產(chǎn)品的技術(shù)要求。目前行業(yè)內(nèi)部分早期探索往往側(cè)重于在交互層接入大模型 API,但我們認(rèn)為這種架構(gòu)可能難以完全滿足具身智能在家庭復(fù)雜場(chǎng)景中的深度落地。
第一,記憶與個(gè)性化能力的缺失。現(xiàn)有的大語(yǔ)言模型聊天機(jī)器人普遍缺乏長(zhǎng)效記憶、多模態(tài)記憶和時(shí)空記憶能力,也無(wú)法精細(xì)化構(gòu)建用戶畫像。這是我們首先要重點(diǎn)突破的方向。
第二,交互與具身能力的割裂。在機(jī)器人場(chǎng)景中,交互不能只依賴語(yǔ)言,還必須與具身智能的大腦能力深度融合。如果交互用一套模型、任務(wù)規(guī)劃和拆解用另一套模型,中間的“縫合”工作會(huì)非常復(fù)雜。尤其是在人與機(jī)器人交互過(guò)程中,用戶會(huì)頻繁打斷、糾正、重新規(guī)劃任務(wù),這要求交互與具身任務(wù)規(guī)劃必須在同一模型內(nèi)天然協(xié)同,實(shí)現(xiàn)自然的長(zhǎng)程任務(wù)規(guī)劃與執(zhí)行,而不是兩套獨(dú)立系統(tǒng)的簡(jiǎn)單拼接。
因此,我們追求的是語(yǔ)言、姿態(tài)、操作與具身大小腦協(xié)同統(tǒng)一的聯(lián)動(dòng)系統(tǒng),所有這些能力將在同一個(gè)模型中整合。
DeepTech:關(guān)于機(jī)器人的長(zhǎng)期記憶存儲(chǔ),你們是如何考慮的?是放在本體還是上云?
陶帥:記憶能力一方面支撐“千人千面”的個(gè)性化體驗(yàn),另一方面也是實(shí)現(xiàn)具身智能長(zhǎng)程復(fù)雜任務(wù)的技術(shù)底座。核心問(wèn)題在于:存什么數(shù)據(jù)、數(shù)據(jù)怎么用、記憶如何演進(jìn)?
我們已經(jīng)構(gòu)建了一套基于個(gè)性化獎(jiǎng)勵(lì)機(jī)制的 reward 系統(tǒng),通過(guò)強(qiáng)化學(xué)習(xí)來(lái)驅(qū)動(dòng)記憶的演進(jìn)與更新。在存儲(chǔ)層面,我們采取分層策略:原始的用戶數(shù)據(jù),為確保隱私安全,會(huì)嚴(yán)格放在本地存儲(chǔ)和處理;二次挖掘的脫敏數(shù)據(jù),經(jīng)過(guò)用戶授權(quán),采用端云協(xié)同的方式。
DeepTech:在解決具身智能缺乏個(gè)性化和自主做事能力差的痛點(diǎn)上,你們的底層模型和算法架構(gòu)做了哪些創(chuàng)新和優(yōu)化?
陶帥:在個(gè)性化方面,我們采用了“全時(shí)空多模態(tài)記憶框架”。它不是簡(jiǎn)單存儲(chǔ)數(shù)據(jù)或做上下文嵌入,底層是一套由強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)的記憶管理、演進(jìn)與模型融合的范式。
在自主持續(xù)做事能力方面,我們的工作主要體現(xiàn)在兩部分:一是 Wild2Bot 數(shù)據(jù)框架,即通過(guò)部署環(huán)境中的數(shù)據(jù)持續(xù)提升具身智能的能力;二是真機(jī)強(qiáng)化學(xué)習(xí),這也是我們團(tuán)隊(duì)積累較多的方向。
DeepTech:在具身智能領(lǐng)域,數(shù)據(jù)往往被視為最深的技術(shù)護(hù)城河。你們訓(xùn)練機(jī)器人的數(shù)據(jù)從何而來(lái)?
陶帥:我們內(nèi)部構(gòu)建了一套名為“BetaData”的三階段數(shù)據(jù)框架。
第一階段(部署前):傳統(tǒng)的數(shù)據(jù)金字塔模式,包含互聯(lián)網(wǎng)開(kāi)源數(shù)據(jù)、umi 眾包采集、真機(jī)遙操作等,能讓機(jī)器人的基礎(chǔ)操作能力達(dá)到 60-70分,覆蓋家庭常見(jiàn)頭部物品。
第二階段(部署后觀察學(xué)習(xí)):機(jī)器人進(jìn)入家庭后,通過(guò)傳感器觀察人類真實(shí)操作,構(gòu)建 Wild2Bot 數(shù)據(jù)飛輪。我們?yōu)榇舜罱瞬渴饒?chǎng)景內(nèi)的可控生成世界模型,這將成為未來(lái)最主要的數(shù)據(jù)來(lái)源,也更符合數(shù)據(jù)的第一性原理。
第三階段(真機(jī)強(qiáng)化學(xué)習(xí)):當(dāng)模型能力達(dá)到 80-90 分后,通過(guò)真機(jī)在真實(shí)環(huán)境中的自主試錯(cuò)與練習(xí),將精度提升至 99% 以上。
DeepTech:未來(lái)的規(guī)劃時(shí)間線是怎樣的?比如什么時(shí)候發(fā)布真機(jī),以及數(shù)據(jù)三階段的時(shí)間節(jié)點(diǎn)如何安排?
陶帥:我們有一個(gè)大的時(shí)間線,但機(jī)器人智能技術(shù)本身發(fā)展很快,節(jié)奏也在動(dòng)態(tài)調(diào)整。
今年的重點(diǎn)是把技術(shù)底座和旗艦本體的核心能力做到跨代級(jí)的體驗(yàn),尤其是幾大基座能力:多模態(tài)個(gè)性化交互、室內(nèi)極致自主移動(dòng)與語(yǔ)音建圖,以及操作層面的數(shù)據(jù)飛輪。真正規(guī)模化的量產(chǎn)和供應(yīng)鏈打磨計(jì)劃放在明年上半年。后續(xù)也會(huì)考慮出海。
DeepTech:你們的目標(biāo)市場(chǎng)主要在海外?
陶帥:我們是全球布局,國(guó)內(nèi)和海外都會(huì)有相應(yīng)的產(chǎn)品規(guī)劃。不過(guò)某些場(chǎng)景確實(shí)更適配海外市場(chǎng)。比如偏家務(wù)類的操作能力,當(dāng)產(chǎn)品達(dá)到較好的成熟度和付費(fèi)能力后,北美和海外市場(chǎng)的適配性更高。國(guó)內(nèi)勞動(dòng)力成本相對(duì)較低、居住空間也偏小,家務(wù)場(chǎng)景的付費(fèi)能力沒(méi)有那么強(qiáng)。當(dāng)然,國(guó)內(nèi)市場(chǎng)仍然是打磨產(chǎn)品和技術(shù)的重要階段,像多模態(tài)交互、自主移動(dòng)等具身智能的通用能力,在國(guó)內(nèi)同樣有市場(chǎng)需求。
DeepTech:考慮到國(guó)內(nèi)外市場(chǎng)的差異,比如海外住宅面積更大、人工成本更高,而國(guó)內(nèi)可能有更多“三代同堂”的家庭結(jié)構(gòu),家務(wù)訴求也不盡相同。在用戶偏好層面,你們是如何看待這種地域性差異的?
陶帥:這更多是產(chǎn)品層面的問(wèn)題。我們?cè)趪?guó)內(nèi)一、二、三線城市以及海外都做了大量用戶調(diào)研,發(fā)現(xiàn)了一些差異化需求。比如家務(wù)場(chǎng)景的偏好、交互方式、付費(fèi)點(diǎn)等,不同地域都不一樣。
從產(chǎn)品設(shè)計(jì)上,我們會(huì)做地域化的區(qū)分,這也是“千人千面”個(gè)性化能力的一部分,不僅體現(xiàn)在不同家庭之間,也體現(xiàn)在不同地域之間。從技術(shù)底座上,我們也會(huì)做好數(shù)據(jù)隱私和安全性的分級(jí)技術(shù)方案,因?yàn)椴煌赜驅(qū)χ悄苣芰Φ慕邮芏纫泊嬖诓町悺?/p>
DeepTech:近期像 Figure AI 等國(guó)內(nèi)外企業(yè)進(jìn)行了多場(chǎng)聚焦日常場(chǎng)景的機(jī)器人實(shí)機(jī)直播,引發(fā)了行業(yè)熱議。你如何評(píng)價(jià)他們的優(yōu)勢(shì)與不足?你們未來(lái)如何競(jìng)爭(zhēng)與超越?
陶帥:國(guó)內(nèi)方面,雖然入局者眾多,但從目前展示的技術(shù)和數(shù)據(jù)來(lái)看,整體仍處于初級(jí)階段。無(wú)論是交互與具身智能的融合能力,還是消費(fèi)級(jí)本體的設(shè)計(jì)能力,距離我們預(yù)期的狀態(tài)還有很大差距。
海外方面,幾家頭部企業(yè)展示的技術(shù)理念值得認(rèn)可,有些與我們不謀而合。比如我們?nèi)ツ甑滋岢鲇洃浤芰烷L(zhǎng)周期復(fù)雜任務(wù)編排,今年 3 月 pi(Physical Intelligence)團(tuán)隊(duì)也發(fā)表了多模態(tài)長(zhǎng)短期記憶對(duì)長(zhǎng)程任務(wù)提升的工作,說(shuō)明行業(yè)理念正在逐步收斂。至于 Figure AI,他們展示的 Demo 確實(shí)不錯(cuò),但整體效果在預(yù)期之內(nèi)。
相比海外競(jìng)爭(zhēng)對(duì)手,我們的特點(diǎn)主要體現(xiàn)在兩點(diǎn):
第一,軟硬件協(xié)同的系統(tǒng)級(jí)優(yōu)勢(shì)。國(guó)內(nèi)供應(yīng)鏈和本體產(chǎn)業(yè)基礎(chǔ)較好,我們?cè)谲浻布f(xié)同設(shè)計(jì)與頂層算法優(yōu)化上具備空間;第二,用戶體驗(yàn)的打磨,在 C 端用戶體驗(yàn)上,國(guó)內(nèi)團(tuán)隊(duì)在移動(dòng)互聯(lián)網(wǎng)時(shí)代已全面領(lǐng)先海外——抖音、微信等都是例證,在具身智能時(shí)代,尤其消費(fèi)級(jí)市場(chǎng),我們也有相應(yīng)的信心。
DeepTech:你們屬于華為系的創(chuàng)業(yè)團(tuán)隊(duì)之一,目前華為系出來(lái)做具身智能的團(tuán)隊(duì)不少。你認(rèn)為你們的產(chǎn)品邏輯和工程邏輯與其他團(tuán)隊(duì)相比有什么不同?
陶帥:我們認(rèn)為具身智能的落地是一個(gè)綜合性系統(tǒng)工程,單靠自動(dòng)駕駛或某一單一技術(shù)棧不夠。我們的不同之處主要體現(xiàn)在兩個(gè)方面:
第一,創(chuàng)始團(tuán)隊(duì)是“華為+字節(jié)”的組合。華為這邊主要輸入的是自動(dòng)駕駛和大模型底層研發(fā)能力;而我這邊則帶來(lái)線上個(gè)性化推薦系統(tǒng)和復(fù)雜 AI 系統(tǒng)架構(gòu)的經(jīng)驗(yàn)。兩者結(jié)合,我們認(rèn)為是適配消費(fèi)級(jí)落地場(chǎng)景的組合之一。這既不是單純的自動(dòng)駕駛技術(shù)遷移,也不是偏學(xué)術(shù)的 Demo 演示,而是面向真實(shí)落地的綜合能力。
第二,在融資節(jié)奏和發(fā)展理念上,我們更傾向于穩(wěn)扎穩(wěn)打。現(xiàn)在行業(yè)里年輕創(chuàng)業(yè)者很多,熱錢也很多,但我們選擇拒絕資本催熟的模式,堅(jiān)持從系統(tǒng)落地做起。
運(yùn)營(yíng)/排版:何晨龍
注:封面/首圖由 AI 輔助生成
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.