投身具身智能，它石丁文超：知行合一解決高價值難題

2026-05-13 09:56:07　來源: 經(jīng)濟發(fā)展網(wǎng)

湖北舉報

分享至

　　90后、“天才少年”、博導...它石智航首席科學家丁文超身上有不少標簽。他曾參與主導真正意義上的第一代智能駕駛解決方案，如今是它石智航首席科學家，同時也是復旦大學智能機器人與先進制造創(chuàng)新學院青年研究員、博士生導師。

　　不過在丁文超看來，外界賦予他的身份一直在變化，但他的自我定位并沒有改變。他說：“我一直把自己定位成一個解決問題的人。”

　　丁文超最初選擇加入復旦，是因為自己最喜歡做研究。但當具身智能浪潮到來后，他又走上創(chuàng)業(yè)道路。據(jù)解放日報報道，在他看來，具身智能是一個足夠大的賽道，它不僅需要前沿研究，還需要超大規(guī)模真實數(shù)據(jù)、具身模型開發(fā)，以及真正滿足產(chǎn)業(yè)需求的批量化應用能力。這些要素都決定了，創(chuàng)業(yè)成為推動技術(shù)落地的必選項。

　　與許多公司選擇更容易展示效果的機器人表演不同，它石智航一開始就進入工業(yè)現(xiàn)場，并選擇了柔性線束裝配這一高難度場景。只有在真實世界中，才能檢驗具身智能是否真正具備價值。

　　據(jù)解放日報觀察，丁文超對技術(shù)的理解中帶有明顯的哲學色彩。他喜歡哲學，也常從中國傳統(tǒng)思想中尋找靈感。早年研究自動駕駛時，他曾從王陽明“格竹”的故事中獲得啟發(fā)：要預測道路上“加塞”等隨機行為，不能只盯著外部車輛運動軌跡，更要回到人的行為邏輯本身。

　　如今投身具身智能，他再次想到王陽明，并頻繁提到“知行合一”。在丁文超看來，具身智能中的“世界模型”并不是一個抽象概念，而是與人的認知和行動邏輯相通：人類在做一件事之前，會根據(jù)經(jīng)驗在腦海中進行推演，預測行動帶來的后果，再選擇更合理的路徑完成任務。

　　他舉例說，人做飯時會預判火候、調(diào)味和烹飪步驟之間的關(guān)系；具身世界模型也應具備類似能力。給機器人一個任務和初始畫面，它應當能夠“想象”接下來應該怎么做、這樣做會產(chǎn)生什么結(jié)果，并據(jù)此完成操作。

　　更重要的是，深度學習不能被簡單理解為“從輸入到輸出”的粗暴擬合，真正重要的是底層洞見和化繁為簡的能力。他以語言模型為例，復雜問題的求解看似千頭萬緒，但訓練邏輯可以歸約為“預測下一個詞”。如果模型能夠推理出偵探小說中的兇手是誰，就意味著它已經(jīng)理解了全書的邏輯鏈條。

　　具身智能同樣如此。看似復雜的桌面整理、工業(yè)裝配、長程操作，本質(zhì)上都可以被拆解為一系列基礎子動作及其智能映射。只要人工神經(jīng)網(wǎng)絡掌握足夠關(guān)鍵的簡單映射邏輯，就有可能勝任高復雜度、長流程的現(xiàn)實任務。

　　從自動駕駛到具身智能，從高校研究者到創(chuàng)業(yè)公司首席科學家，丁文超始終圍繞一個核心問題展開工作：如何讓AI真正理解復雜世界，并解決現(xiàn)實中的困難任務。正如他所說，只要回到事物最底層的基本事實，從第一性原理把問題想通，就會堅定地快速向前奔跑。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.