當(dāng)前,具身智能賽道持續(xù)升溫,圍繞人形機器人、工業(yè)機器人和通用具身大模型的投資與討論不斷增加。面對外界關(guān)于行業(yè)是否存在泡沫的質(zhì)疑,它石智航首席科學(xué)家丁文超給出的判斷是:“人們還是低估了它。”
當(dāng)前,公眾對具身智能的想象,仍然較多停留在人形機器人跳舞、跑馬拉松等直觀展示上。但真正值得關(guān)注的,是具身基礎(chǔ)模型能力正在沿著類似語言大模型的發(fā)展曲線快速進(jìn)步。一旦能力達(dá)到某個拐點,機器人就可能大規(guī)模承擔(dān)重復(fù)性、高強度體力勞動,顯著節(jié)省人類在相關(guān)場景中的投入。
丁文超認(rèn)為,具身智能的“ChatGPT時刻”可能在約兩年后出現(xiàn)。他判斷,在重復(fù)性較高的場景中,經(jīng)過通用基礎(chǔ)模型訓(xùn)練的機器人被部署到現(xiàn)場后,只需要采集極少量本地數(shù)據(jù),就能夠較快適應(yīng)任務(wù)并開始工作。
這一判斷背后,是它石智航對具身智能技術(shù)路線的長期思考。與大語言模型主要處理文本不同,具身智能需要理解物理世界、預(yù)測環(huán)境變化,并通過機器人身體與現(xiàn)實世界發(fā)生交互。因此,具身智能所需的數(shù)據(jù)規(guī)模和訓(xùn)練難度都遠(yuǎn)超一般想象。
他認(rèn)為,自動駕駛走向成熟需要百萬小時級別的數(shù)據(jù)積累,而具身智能面對的是更加復(fù)雜的物理交互環(huán)境,數(shù)據(jù)需求可能達(dá)到千萬小時級別。依靠傳統(tǒng)遙操作方式采集數(shù)據(jù)效率有限,完全通過手工建模還原真實世界又過于困難。因此,它石智航選擇從人的第一視角出發(fā),利用穿戴式設(shè)備采集人類真實操作數(shù)據(jù),再訓(xùn)練具身世界模型,將人的能力遷移到機器人身上。
據(jù)解放日報報道,它石智航已經(jīng)在產(chǎn)業(yè)場景中驗證了這一技術(shù)路徑。在2026年中國家電及消費電子博覽會上,其自研通用具身大模型AWE3.0支持A1機器人連續(xù)完成百余次亞毫米級線束精密裝配任務(wù),并獲得吉尼斯世界紀(jì)錄。這一案例被視為具身大模型從實驗室走向工業(yè)現(xiàn)場的重要信號。
![]()
當(dāng)前,中國在具身智能的“本體”和“小腦”方面具備優(yōu)勢,也就是機器人硬件本體的一致性量產(chǎn)能力和運動控制能力較強;但在“大腦”層面,也就是具身基礎(chǔ)模型、大規(guī)模數(shù)據(jù)訓(xùn)練和通用智能能力方面,與世界頂級水平相比仍有差距。如今美國正試圖借助具身智能推動制造業(yè)回流,如果中國在具身智能“大腦”層面落后,未來可能削弱自身制造業(yè)長期積累的競爭優(yōu)勢。
正因如此,它石智航將目標(biāo)瞄準(zhǔn)“沖刺具身智能世界第一”。它石堅持具身智能不應(yīng)只是資本市場的熱門概念,而應(yīng)成為推動產(chǎn)業(yè)升級的新型生產(chǎn)力。尤其是在工廠中大量存在的重復(fù)性、高強度、精密操作場景里,機器人一旦具備通用學(xué)習(xí)和適應(yīng)能力,就可能帶來深刻變革。
未來,具身智能最值得期待的方向,不是讓機器人完成更吸引眼球的表演,而是讓機器人真正進(jìn)入現(xiàn)實世界,解決那些長期存在、依賴人工、難以自動化的生產(chǎn)痛點。換句話說,具身智能的真正拐點,將出現(xiàn)在機器人開始穩(wěn)定、可靠、批量地“干活”的那一刻。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.