90后、“天才少年”、博導...它石智航首席科學家丁文超身上有不少標簽。他曾參與主導真正意義上的第一代智能駕駛解決方案,如今是它石智航首席科學家,同時也是復旦大學智能機器人與先進制造創(chuàng)新學院青年研究員、博士生導師。
不過在丁文超看來,外界賦予他的身份一直在變化,但他的自我定位并沒有改變。他說:“我一直把自己定位成一個解決問題的人。”
丁文超最初選擇加入復旦,是因為自己最喜歡做研究。但當具身智能浪潮到來后,他又走上創(chuàng)業(yè)道路。據(jù)解放日報報道,在他看來,具身智能是一個足夠大的賽道,它不僅需要前沿研究,還需要超大規(guī)模真實數(shù)據(jù)、具身模型開發(fā),以及真正滿足產(chǎn)業(yè)需求的批量化應用能力。這些要素都決定了,創(chuàng)業(yè)成為推動技術(shù)落地的必選項。
與許多公司選擇更容易展示效果的機器人表演不同,它石智航一開始就進入工業(yè)現(xiàn)場,并選擇了柔性線束裝配這一高難度場景。只有在真實世界中,才能檢驗具身智能是否真正具備價值。
據(jù)解放日報觀察,丁文超對技術(shù)的理解中帶有明顯的哲學色彩。他喜歡哲學,也常從中國傳統(tǒng)思想中尋找靈感。早年研究自動駕駛時,他曾從王陽明“格竹”的故事中獲得啟發(fā):要預測道路上“加塞”等隨機行為,不能只盯著外部車輛運動軌跡,更要回到人的行為邏輯本身。
如今投身具身智能,他再次想到王陽明,并頻繁提到“知行合一”。在丁文超看來,具身智能中的“世界模型”并不是一個抽象概念,而是與人的認知和行動邏輯相通:人類在做一件事之前,會根據(jù)經(jīng)驗在腦海中進行推演,預測行動帶來的后果,再選擇更合理的路徑完成任務。
他舉例說,人做飯時會預判火候、調(diào)味和烹飪步驟之間的關(guān)系;具身世界模型也應具備類似能力。給機器人一個任務和初始畫面,它應當能夠“想象”接下來應該怎么做、這樣做會產(chǎn)生什么結(jié)果,并據(jù)此完成操作。
更重要的是,深度學習不能被簡單理解為“從輸入到輸出”的粗暴擬合,真正重要的是底層洞見和化繁為簡的能力。他以語言模型為例,復雜問題的求解看似千頭萬緒,但訓練邏輯可以歸約為“預測下一個詞”。如果模型能夠推理出偵探小說中的兇手是誰,就意味著它已經(jīng)理解了全書的邏輯鏈條。
![]()
具身智能同樣如此。看似復雜的桌面整理、工業(yè)裝配、長程操作,本質(zhì)上都可以被拆解為一系列基礎子動作及其智能映射。只要人工神經(jīng)網(wǎng)絡掌握足夠關(guān)鍵的簡單映射邏輯,就有可能勝任高復雜度、長流程的現(xiàn)實任務。
從自動駕駛到具身智能,從高校研究者到創(chuàng)業(yè)公司首席科學家,丁文超始終圍繞一個核心問題展開工作:如何讓AI真正理解復雜世界,并解決現(xiàn)實中的困難任務。正如他所說,只要回到事物最底層的基本事實,從第一性原理把問題想通,就會堅定地快速向前奔跑。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.