具身智能“ChatGPT時刻”還有多遠(yuǎn)？它石丁文超：約兩年可見拐點

2026-05-13 11:32:04　來源: 經(jīng)濟(jì)發(fā)展網(wǎng)

湖北舉報

分享至

　　當(dāng)前，具身智能賽道持續(xù)升溫，圍繞人形機器人、工業(yè)機器人和通用具身大模型的投資與討論不斷增加。面對外界關(guān)于行業(yè)是否存在泡沫的質(zhì)疑，它石智航首席科學(xué)家丁文超給出的判斷是：“人們還是低估了它。”

　　當(dāng)前，公眾對具身智能的想象，仍然較多停留在人形機器人跳舞、跑馬拉松等直觀展示上。但真正值得關(guān)注的，是具身基礎(chǔ)模型能力正在沿著類似語言大模型的發(fā)展曲線快速進(jìn)步。一旦能力達(dá)到某個拐點，機器人就可能大規(guī)模承擔(dān)重復(fù)性、高強度體力勞動，顯著節(jié)省人類在相關(guān)場景中的投入。

　　丁文超認(rèn)為，具身智能的“ChatGPT時刻”可能在約兩年后出現(xiàn)。他判斷，在重復(fù)性較高的場景中，經(jīng)過通用基礎(chǔ)模型訓(xùn)練的機器人被部署到現(xiàn)場后，只需要采集極少量本地數(shù)據(jù)，就能夠較快適應(yīng)任務(wù)并開始工作。

　　這一判斷背后，是它石智航對具身智能技術(shù)路線的長期思考。與大語言模型主要處理文本不同，具身智能需要理解物理世界、預(yù)測環(huán)境變化，并通過機器人身體與現(xiàn)實世界發(fā)生交互。因此，具身智能所需的數(shù)據(jù)規(guī)模和訓(xùn)練難度都遠(yuǎn)超一般想象。

　　他認(rèn)為，自動駕駛走向成熟需要百萬小時級別的數(shù)據(jù)積累，而具身智能面對的是更加復(fù)雜的物理交互環(huán)境，數(shù)據(jù)需求可能達(dá)到千萬小時級別。依靠傳統(tǒng)遙操作方式采集數(shù)據(jù)效率有限，完全通過手工建模還原真實世界又過于困難。因此，它石智航選擇從人的第一視角出發(fā)，利用穿戴式設(shè)備采集人類真實操作數(shù)據(jù)，再訓(xùn)練具身世界模型，將人的能力遷移到機器人身上。

　　據(jù)解放日報報道，它石智航已經(jīng)在產(chǎn)業(yè)場景中驗證了這一技術(shù)路徑。在2026年中國家電及消費電子博覽會上，其自研通用具身大模型AWE3.0支持A1機器人連續(xù)完成百余次亞毫米級線束精密裝配任務(wù)，并獲得吉尼斯世界紀(jì)錄。這一案例被視為具身大模型從實驗室走向工業(yè)現(xiàn)場的重要信號。

　　當(dāng)前，中國在具身智能的“本體”和“小腦”方面具備優(yōu)勢，也就是機器人硬件本體的一致性量產(chǎn)能力和運動控制能力較強；但在“大腦”層面，也就是具身基礎(chǔ)模型、大規(guī)模數(shù)據(jù)訓(xùn)練和通用智能能力方面，與世界頂級水平相比仍有差距。如今美國正試圖借助具身智能推動制造業(yè)回流，如果中國在具身智能“大腦”層面落后，未來可能削弱自身制造業(yè)長期積累的競爭優(yōu)勢。

　　正因如此，它石智航將目標(biāo)瞄準(zhǔn)“沖刺具身智能世界第一”。它石堅持具身智能不應(yīng)只是資本市場的熱門概念，而應(yīng)成為推動產(chǎn)業(yè)升級的新型生產(chǎn)力。尤其是在工廠中大量存在的重復(fù)性、高強度、精密操作場景里，機器人一旦具備通用學(xué)習(xí)和適應(yīng)能力，就可能帶來深刻變革。

　　未來，具身智能最值得期待的方向，不是讓機器人完成更吸引眼球的表演，而是讓機器人真正進(jìn)入現(xiàn)實世界，解決那些長期存在、依賴人工、難以自動化的生產(chǎn)痛點。換句話說，具身智能的真正拐點，將出現(xiàn)在機器人開始穩(wěn)定、可靠、批量地“干活”的那一刻。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.