<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      英偉達拿出推理版VLA:Alpamayo-R1讓自動駕駛AI更會動腦子

      0
      分享至



      一、自動駕駛的瓶頸:「看」得見,卻「想」不明白

      當今自動駕駛模型越來越強大,攝像頭、雷達、Transformer 網絡一齊上陣,似乎什么都「看得見」。但真正的挑戰(zhàn)在于:模型能否像人一樣「想明白」為什么要這么開?

      傳統(tǒng)的端到端(E2E)系統(tǒng)雖然能從感知到控制一氣呵成,卻常在「長尾場景」翻車 —— 比如:

      • 迎面來車違規(guī)左轉;
      • 行人突然闖入;
      • 臨時施工、交通標志被遮擋。

      這些「極少數但容易發(fā)生事故」的場景正是當前系統(tǒng)的盲點。

      二、Alpamayo-R1:給模型裝上「推理鏈條」

      NVIDIA Research 推出的Alpamayo-R1(AR1),是一種全新的帶有推理能力的視覺 - 語言 - 行動模型(Reasoning VLA),讓車輛不只是「執(zhí)行指令」,而是能在決策前「推理出因果關系」。



      圖 1:Alpamayo-R1 模型架構(示意)

      AR1 的核心創(chuàng)新有三個方面:

      1. Chain of Causation(因果鏈)數據集

      AR1 引入了一套全新的數據標注體系:每一段駕駛數據不僅有「做了什么」,還有 「為什么這樣做」。例如:「減速并左變道,是因為前方有助動車等紅燈,且左側車道空閑。」



      圖 2:因果鏈(CoC)標注示例

      2. Diffusion-based Trajectory Decoder(擴散式軌跡解碼器)

      AR1 引入了一種基于擴散模型的軌跡解碼器,它能在實時約束下生成連續(xù)、動態(tài)可行的駕駛軌跡。該模塊結合語言推理輸出與物理約束,實現(xiàn)從推理到控制的無縫銜接。

      3. Multi-Stage Training(多階段訓練策略)

      AR1 是基于 NVIDIA 的 Cosmos Reason 模型,這是一種專為物理 AI(Physical AI)設計的推理視覺語言模型;并采用多階段訓練策略:首先在大規(guī)模駕駛數據上做模態(tài)注入,學習從視覺到動作的基本映射;第二階段在 CoC 因果鏈數據上做監(jiān)督微調,顯式教會模型「先想清楚再開」;最后通過強化學習(RL)進一步優(yōu)化推理質量、推理 - 行動一致性和軌跡安全性。

      這種分階段、分目標的訓練流程,使得模型在開放場景、長尾危險場景中都表現(xiàn)的更加穩(wěn)健。

      三、性能飛躍:更穩(wěn)、更準、更懂你

      在實驗中,AR1 為以下性能帶來了顯著提升:

      • 規(guī)劃精度提升 12%
      • 越界率降低 35%
      • 近碰率降低 25%
      • 推理 - 行動一致性提升 37%
      • ? 實時性能:99 ms 端到端延遲

      更重要的是,這些提升主要體現(xiàn)在以往最容易出錯的「長尾場景」中 —— 也就是說,它更接近「真正會判斷的司機」。

      四、Vision Encoding:高效多相機時序感知

      AR1 的輸入由多相機、多時序觀測幀組成,同時可以選配高層語言輸入(如導航指令或駕駛目標)。所有輸入(包括歷史自車運動)會被統(tǒng)一編碼成多模態(tài) token 序列,按時序和傳感器順序排列,再送入主干模型 Cosmos-Reason 進行推理與預測。

      在這一過程中:

      • 每個相機視角先經過輕量級 CNN 與時間注意力模塊做特征壓縮與時序建模;
      • 多相機特征隨后融合為 BEV(鳥瞰圖)表征;
      • 所有模態(tài)(圖像、導航文本、自車狀態(tài))被 token 化后統(tǒng)一輸入 Transformer;
      • 模型的輸出包含三類 token:推理鏈(reasoning traces)、中層動作(meta-actions)與未來軌跡預測(trajectories)。

      這種統(tǒng)一編碼方式讓模型具備了多模態(tài)語義理解與運動狀態(tài)感知的「一體化」能力。

      五、數據的靈魂:結構化標注的革命

      AR1 的 CoC 數據集采用「人機協(xié)同標注」機制:

      • 人工部分:標注關鍵幀、核心因果因素(如紅燈、行人、障礙物),并撰寫推理鏈。
      • 自動部分:通過 GPT-5 等大模型自動生成初版推理,再由人類審查。
      • 質量審核:每條樣本通過因果覆蓋、因果正確性、近因優(yōu)先等四項規(guī)則嚴格把關。

      最終形成數十萬條高質量推理 - 行動樣本,使 VLA 模型能真正「理解因果,而非記憶現(xiàn)象」。



      圖 3:CoC 數據標注流程示意圖

      六、Multi-Stage Training:從常識推理到行為控制

      Alpamayo-R1 的訓練分為三個階段,旨在讓模型從「看懂」到「會想」再到「能開」。



      圖 4: AR1 訓練流程示意圖

      1. 監(jiān)督微調(Supervised Fine-Tuning, SFT)

      基于 Cosmos-Reason 的預訓練權重進行微調。該主干模型原本在 370 萬條 VQA 數據上后訓練(post-training),其中包括 2.47 萬條專為駕駛設計的視頻樣本,帶有場景描述、駕駛難度和推理軌跡標注,幫助模型建立「物理常識」和 「因果直覺」。

      此外還構建了額外的 10 萬條駕駛樣本,標注關鍵目標、交通信號、因果行為解釋等信息,用于領域自適應微調。

      2. 因果鏈監(jiān)督階段(CoC Supervision)

      引入 CoC 因果鏈數據集,顯式監(jiān)督模型的推理輸出,使其能回答「為什么要減速」、「為什么左轉」。這一階段通過人工 + 教師模型(如 GPT-5)生成高質量推理樣本,使模型在策略學習前先獲得強大的語言 - 推理能力。

      3. 強化學習后訓練優(yōu)化(Reinforcement Learning based Post-Training)。

      在最終階段,英偉達通過強化學習對模型進行策略微調,以進一步提升其在推理精準性、推理–行動一致性、軌跡平滑性以及閉環(huán)控制穩(wěn)定性等方面的表現(xiàn)。

      Alpamayo-R1 引入了多維度獎勵機制:包括由專家級推理模型提供的反饋信號,用于評估并引導模型生成更具因果邏輯的推理;「推理–行動一致性(Reasoning–Action Consistency)」獎勵,用于鼓勵模型依據自身推理合理執(zhí)行動作;以及底層安全獎勵,用以促進模型生成更加安全、平滑且可執(zhí)行的運動軌跡。

      七、未來展望:邁向可解釋的 L4 自動駕駛

      AR1 的設計理念可以看作是自動駕駛從「黑箱」到「白箱」的轉折點。

      它不再只是一個會開車的 AI,而是一個能告訴你「為什么這樣開」的駕駛員。

      ? 小結:讓自動駕駛「有理可講」

      Alpamayo-R1 的意義不止在性能提升,更在于:它讓 AI 的「推理鏈」與物理世界的「行動鏈」形成真正的閉環(huán)。

      當車輛能解釋自己的每一個決策時,才能確保更加安全,信任與普及才會得以實現(xiàn)。

      一句話總結:AR1 = 會開車 + 會思考 + 會解釋的自動駕駛模型。

      詳細內容請查看:https://research.nvidia.com/publication/2025-10_alpamayo-r1

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      7座車為啥越賣越少?車主坦言:多2座,卻多了4個鬧心缺陷

      7座車為啥越賣越少?車主坦言:多2座,卻多了4個鬧心缺陷

      音樂時光的娛樂
      2026-05-04 23:51:39
      回顧:緬北女魔頭魏榕嗜好!經常“活剝驢耳”,3個閨蜜喜歡觀刑

      回顧:緬北女魔頭魏榕嗜好!經常“活剝驢耳”,3個閨蜜喜歡觀刑

      飛云如水
      2024-11-13 06:54:13
      臥室頂部半夜突掉兩水泥塊,砸爛吊頂后掉落床上,女子睡夢中被砸傷縫4針,要求調換房子遭拒

      臥室頂部半夜突掉兩水泥塊,砸爛吊頂后掉落床上,女子睡夢中被砸傷縫4針,要求調換房子遭拒

      大風新聞
      2026-05-05 13:13:04
      天雷滾滾,9個龍頭虧超100億,53股虧超20億,巨虧股是4個方向

      天雷滾滾,9個龍頭虧超100億,53股虧超20億,巨虧股是4個方向

      鵬哥投研
      2026-05-05 16:19:49
      26死61傷!華盛煙花廠逃生員工直言一連串“幸運”,讓他全身而退

      26死61傷!華盛煙花廠逃生員工直言一連串“幸運”,讓他全身而退

      火山詩話
      2026-05-05 17:13:09
      相差15歲姐弟戀!00后體育生愛上重慶單親媽媽,喜歡叫對方姐姐

      相差15歲姐弟戀!00后體育生愛上重慶單親媽媽,喜歡叫對方姐姐

      那年秋天
      2026-05-03 11:50:10
      記者:內馬爾入選巴西50人大名單,但掌摑事件讓他的出征前景存疑

      記者:內馬爾入選巴西50人大名單,但掌摑事件讓他的出征前景存疑

      懂球帝
      2026-05-05 16:09:33
      內蒙古自治區(qū)林業(yè)和草原監(jiān)測規(guī)劃院生態(tài)工程監(jiān)測室主任彌宏卓——“為筑牢生態(tài)安全屏障出力”(勞動者之歌)

      內蒙古自治區(qū)林業(yè)和草原監(jiān)測規(guī)劃院生態(tài)工程監(jiān)測室主任彌宏卓——“為筑牢生態(tài)安全屏障出力”(勞動者之歌)

      國際在線
      2026-05-02 11:58:49
      中國公民在國外遇害,同胞曝猛料,現(xiàn)場慘烈疑割喉,殺完果斷逃跑

      中國公民在國外遇害,同胞曝猛料,現(xiàn)場慘烈疑割喉,殺完果斷逃跑

      林子說事
      2026-05-05 12:04:34
      世錦賽落幕!誕生4個贏家+3個輸家,吳宜澤、趙心童、墨菲全在列

      世錦賽落幕!誕生4個贏家+3個輸家,吳宜澤、趙心童、墨菲全在列

      侃球熊弟
      2026-05-05 05:52:45
      王平河系列:立足之本(9/10)

      王平河系列:立足之本(9/10)

      金昔說故事
      2026-05-05 15:16:51
      55比0全票通過!菲律賓副總統(tǒng)薩拉被正式“圍獵”,彈劾箭已在弦上

      55比0全票通過!菲律賓副總統(tǒng)薩拉被正式“圍獵”,彈劾箭已在弦上

      麓谷隱士
      2026-05-05 00:06:17
      連續(xù)三天嫖娼一次嫖倆,花800元毀掉一手女神好牌,他圖什么?

      連續(xù)三天嫖娼一次嫖倆,花800元毀掉一手女神好牌,他圖什么?

      街上的行人很刺眼
      2026-04-25 10:55:49
      挖出戴手銬的女遺骨,鑒定后確定,她就是中央苦苦尋找的人!

      挖出戴手銬的女遺骨,鑒定后確定,她就是中央苦苦尋找的人!

      小莜讀史
      2026-05-04 00:01:32
      翻盤!林詩棟深陷低谷誰能救?王皓狠心調整,肖戰(zhàn)執(zhí)教才有轉機

      翻盤!林詩棟深陷低谷誰能救?王皓狠心調整,肖戰(zhàn)執(zhí)教才有轉機

      小鞄搞笑解說
      2026-05-05 10:31:15
      谷愛凌亮相Met Gala,裸粉泡泡裙,靈動夢幻出圈

      谷愛凌亮相Met Gala,裸粉泡泡裙,靈動夢幻出圈

      述家娛記
      2026-05-05 14:54:01
      張元英,救了霸王茶姬

      張元英,救了霸王茶姬

      i黑馬
      2026-05-05 17:38:25
      號稱“親日”的越南新任總理,親自陪著高市早苗,演上了一出好戲

      號稱“親日”的越南新任總理,親自陪著高市早苗,演上了一出好戲

      今夜繁星墜落
      2026-05-05 01:18:30
      真沒想到啊!一個27號秀,常規(guī)賽場均5分,季后賽場均14分

      真沒想到啊!一個27號秀,常規(guī)賽場均5分,季后賽場均14分

      球毛鬼胎
      2026-05-05 14:28:05
      1979年,黨中央抓捕許世友兒子,許世友得知后:抓得好,抓得妙

      1979年,黨中央抓捕許世友兒子,許世友得知后:抓得好,抓得妙

      大海的諾言
      2024-10-04 08:55:11
      2026-05-05 18:07:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      12917文章數 142642關注度
      往期回顧 全部

      科技要聞

      傳蘋果考慮讓英特爾、三星代工設備處理器

      頭條要聞

      四川一企業(yè)盜采河水作飲用水售賣十年 當地回應

      頭條要聞

      四川一企業(yè)盜采河水作飲用水售賣十年 當地回應

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      英皇25周年演唱會 張敬軒被救護車拉走

      財經要聞

      瀏陽煙花往事

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態(tài)度原創(chuàng)

      手機
      旅游
      親子
      時尚
      軍事航空

      手機要聞

      十年來第一次!蘋果討論漲價:iPhone 18漲幅或超600元

      旅游要聞

      清晨挑戰(zhàn)浮云嶺山路,在終點感受火紅杜鵑的逆光之美,風景舊曾諳

      親子要聞

      千萬別讓孩子養(yǎng)成這4個壞毛病

      夏天最經典的銀色,貴氣十足!

      軍事要聞

      特朗普威脅伊朗不要向美國船開火

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 丰满多毛的大隂户视频| 欧美综合图区亚洲综合图区| 浮力影院①线wy55www| 东北女人毛多水多牲交视频| 日韩一区二| 顶级欧美熟妇xx| 另类图片色五月| 国产精品一区二| 国产精品自在在线午夜| 忘记穿内裤被同桌摸到高潮app| 国产精品老熟女一区二区| 亚洲无码精品电影| 国产在线播放不卡免费视频| 国产成人亚洲综合图区| 亚洲国产免费图区在线视频| 无套内谢少妇毛片A片樱花| 久久综合噜噜激激的五月天| 四虎永久在线精品视频网站| 午夜亚洲影院在线观看| 伊人亚洲综合| 国产精品国语对白露脸在线播放| 日韩精品一区二区三区激| 亚洲无码2025| 日本韩无专砖码高清| 亚洲日本偷拍中文字幕| 无码一区二区三区AV在线播放| 久久中文字幕日韩无码视频| 四虎库影成人在线播放| 无码3p| 一边添奶一边添p好爽视频| AV一区二区三区| 亚洲熟妇自偷自拍另欧美 | 一边摸一边叫床一边爽视频| 国产3P成人在线视频| 国产成人8X人网站视频| 婷婷色香五月综合缴缴情香蕉| 在线播放亚洲欧美日韩| 成人精品不卡| 精品服丝袜无码视频一区| 无码免费毛片手机在线无卡顿| 精品无码av无码专区|