視覺語言導航(VLN)作為具身智能的核心任務之一,要求智能體借助自然語言指令在真實環境中實現自主導航。該任務是一個涉及自然語言處理、計算機視覺、機器人導航、多模態信息融合等多個學科的領域。
在實際工程落地中,VLN面臨以下挑戰:跨模態信息對齊、離散與連續動作空間的差異、仿真環境到物理世界的遷移、以及稀疏獎勵下的策略學習。現有研究主要集中在模型架構優化與數據集構建,但如何系統性地將這些方法轉化為可復現的工程實踐方面,可供參考的資源仍較為分散。
為此,深藍學院聯合阿德萊德大學吳琦老師及視覺語言導航公眾號開設了「視覺語言導航VLN」課程,帶大家全面了解VLN的基礎知識、算法框架、數據資源、學習范式,以及它在現實世界中的應用方式,比如服務機器人、無人機等。以下是課程項目實踐展示:
![]()
(Project:AerialVLN 任務)
掃碼添加,即將開課
搶占特價學習名額
![]()
課程講師
![]()
![]()
課程大綱
![]()
![]()
實踐項目
![]()
![]()
![]()
課程收獲
1. 深入理解VLN任務在具身智能中的定位與挑戰
2. 掌握從感知、語言到行為決策的模型設計方法
3. 熟悉主流數據集、開源框架與評估方法
4. 能夠設計并實現基本的VLN系統,并理解其在不同平臺(機器人、無人機等)中的適配需求
5.為多模態人工智能系統的研發提供理論基礎與技術儲備
![]()
適合人群
1. 機器學習、人工智能、機器人領域的學生和工程師
2. 具身智能領域研究學者
3. 計算機視覺與自然語言處理開發者
![]()
課程服務
1. 三師助力
講師&助教及時答疑解惑,班主任全程帶班督學,幫你克服拖延,不斷進步。
2.定期班會
助教1V1批改作業,并在班會中進行講評和指導;在班會中,學習更多技巧;在交流中收獲更多思路。
![]()
課程咨詢
掃碼添加,即將開課
搶占特價學習名額
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.