7月23日,在封閉高速路段上,懂車(chē)帝對(duì)36款“智駕”車(chē)型進(jìn)行了多個(gè)特殊場(chǎng)景測(cè)試,包括“高速施工”、“匝道遭遇野蠻加塞”、“橫穿的豬”等,毫無(wú)意外,這都屬于長(zhǎng)尾場(chǎng)景。雖然關(guān)于豬的測(cè)試通過(guò)率最低(竄入高速的豬是典型的“非結(jié)構(gòu)化”對(duì)象,通常沒(méi)可能訓(xùn)練到),但“消失的前車(chē)”引發(fā)共鳴最多。大概因?yàn)檫@種場(chǎng)景很多人經(jīng)歷過(guò),因?yàn)轶@險(xiǎn),所以印象深刻。
AEB與高速NCA的沖突
按照懂車(chē)帝的設(shè)定,測(cè)試車(chē)(以下稱“本車(chē)”)以時(shí)速120 km/h跟隨前車(chē)行駛,前車(chē)突然向左變道躲避本車(chē)道事故車(chē),猝不及防的本車(chē),需要在極短時(shí)間內(nèi)完成感知-決策-執(zhí)行閉環(huán)。36輛車(chē),只有5輛車(chē)成功做出了規(guī)避動(dòng)作。
這一測(cè)試,當(dāng)然是不嚴(yán)謹(jǐn)?shù)摹驗(yàn)槊枯v車(chē)面臨的場(chǎng)景條件變量不一致。有的車(chē)測(cè)試時(shí)左車(chē)道是空的(后車(chē)稍遠(yuǎn)),有規(guī)避空間;有的車(chē)面臨左道被占,很難繞行。這就造成了結(jié)果可信性不高。盡管如此,結(jié)果仍然有一定參考價(jià)值。就像懂車(chē)帝自己說(shuō)的,重要的不是第幾,而是人是否安全。
“消失的前車(chē)”,場(chǎng)景設(shè)置非常有技巧,它恰好擊中了智駕系統(tǒng)薄弱的結(jié)合部——AEB(自動(dòng)緊急制動(dòng))和高速NCA(導(dǎo)航輔助駕駛)的沖突問(wèn)題,不管品牌方是否將兩個(gè)功能融合在一起。
在感知層,本車(chē)需要識(shí)別左側(cè)車(chē)流與突然出現(xiàn)的前方靜止障礙的雙重威脅;決策層需要做出決定,變?nèi)胱蟮儡?chē)流空檔內(nèi),還是強(qiáng)力制動(dòng);執(zhí)行層則需要AEB和NCA協(xié)同。
實(shí)際測(cè)試中,多車(chē)出現(xiàn)嚴(yán)重失誤。懂車(chē)帝也出來(lái)解釋說(shuō),很多車(chē)型在AEB被觸發(fā)后,NCA功能被抑制,導(dǎo)致車(chē)輛硬剎,結(jié)果是制動(dòng)距離不夠,仍然撞上障礙物。這還算好的,更多的車(chē)型根本沒(méi)有識(shí)別最大的威脅——本車(chē)道前方靜止障礙,導(dǎo)致一頭撞上去。減速很少或者壓根沒(méi)有減速。
無(wú)論AEB還是NCA,感知層不管有多少個(gè)傳感器源,都是同一組。而決策層則有兩個(gè)模塊,而且不能同時(shí)主導(dǎo)。不過(guò),這只是表面上的模塊沖突導(dǎo)致決策非最優(yōu)。
靜態(tài)決策導(dǎo)致孤立響應(yīng)
當(dāng)前主流智駕普遍采用端到端架構(gòu)。端到端的設(shè)計(jì)思想,就是將傳感器輸入通過(guò)神經(jīng)網(wǎng)絡(luò),直接映射為駕駛控制信號(hào),減少中間模塊誤差傳遞的影響,也避免規(guī)控模式覆蓋空白導(dǎo)致系統(tǒng)失能。
人類熟練駕駛,即便面對(duì)極端場(chǎng)景,基本都是下意識(shí)反應(yīng),這和端到端思路有共同之處。但差別在于,即便電光火石間,人類駕駛員做出決策,也是依據(jù)“連續(xù)時(shí)幀”畫(huà)面做出決斷,而非單純依靠一個(gè)畫(huà)面做出。前者意味著即便做出決斷,隨著時(shí)間流逝發(fā)現(xiàn)新的、更嚴(yán)重威脅,也能及時(shí)矯正,采取新對(duì)策(是否成功另說(shuō))。
而很多端到端模型采取靜態(tài)數(shù)據(jù)輸入(單幀畫(huà)面或者短時(shí)間窗口),忽視駕駛行為本質(zhì)上是一個(gè)強(qiáng)時(shí)序相關(guān)的連續(xù)決策過(guò)程。缺乏時(shí)序建模,導(dǎo)致一些需要隨機(jī)應(yīng)變的場(chǎng)景中,智駕系統(tǒng)表現(xiàn)出呆板、控制漂移、變線失穩(wěn)等。
在“消失的前車(chē)”場(chǎng)景中,前車(chē)緊急剎車(chē)-躲避障礙-左道車(chē)(如果有理智的話)剎車(chē)讓行等行為,站在本車(chē)觀察角度,形成了復(fù)雜的“信號(hào)鏈”。本車(chē)根據(jù)這些時(shí)序信號(hào),也應(yīng)該形成一個(gè)策略序列,而不是孤立的一個(gè)策略。智駕有時(shí)顯得很傻,道理就在這,即靜態(tài)決策必然導(dǎo)致孤立響應(yīng)。
![]()
智駕判斷缺乏隨機(jī)應(yīng)變性,有時(shí)候就顯得很傻
更復(fù)雜的是,其他交通參與者給出的信號(hào),往往具有多義性。同一個(gè)駕駛員即便面對(duì)非常類似的場(chǎng)景,也可能采取不同策略,均為合理行為。但如果這些行為都作為數(shù)據(jù)輸入,容易模型學(xué)習(xí)方向不確定,訓(xùn)練震蕩。如果多個(gè)駕駛員處理類似場(chǎng)景風(fēng)格不同,模型學(xué)習(xí)到的控制行為,可能飄忽不定。最終在高壓場(chǎng)景(比如本文需要極短時(shí)間內(nèi)決斷的場(chǎng)景)下,“既不充分制動(dòng)也不果斷變道”的折衷決策,貌似溫和,其實(shí)是最壞的選擇。
端到端架構(gòu)中,前幀感知偏差(如誤判左側(cè)車(chē)流速度)會(huì)通過(guò)Transformer等序列網(wǎng)絡(luò)不斷放大。測(cè)試中車(chē)輛向左變道時(shí)軌跡線突然消失,正是時(shí)序誤差累積的典型表現(xiàn)。
為什么不用“長(zhǎng)時(shí)幀”
如果簡(jiǎn)單認(rèn)為,采用連續(xù)幀訓(xùn)練就能解決此類困境,可能有點(diǎn)天真了。要考慮為什么不傾向于用長(zhǎng)時(shí)間連續(xù)幀訓(xùn)練。
第一個(gè)理由,容易跳幀。如果連續(xù)幀間的目標(biāo)ID、軌跡或意圖標(biāo)注不一致,會(huì)導(dǎo)致模型誤認(rèn)為是兩個(gè)完全不同的事件,進(jìn)一步削弱其對(duì)跨幀語(yǔ)義的建模能力。簡(jiǎn)單說(shuō),就是系統(tǒng)認(rèn)為這是兩個(gè)完全風(fēng)馬牛的事,導(dǎo)致同一目標(biāo)在兩幀中出現(xiàn)“跳幀”、“漂移”甚至“消失”,這可真成了“消失的前車(chē)”了。
連續(xù)幀不僅記錄時(shí)空變化,更為關(guān)鍵的是提供了其他交通參與者的真實(shí)意圖。人類司機(jī)不也是靠著連續(xù)觀察,判斷旁道車(chē)輛到底想直接加塞,還是想讓行后再加入進(jìn)來(lái)——對(duì)行人意圖的判斷更是如此(因?yàn)槠錄](méi)有轉(zhuǎn)向指示燈)。
![]()
優(yōu)化后的標(biāo)識(shí)呈現(xiàn)
個(gè)別端到端系統(tǒng),和人類判斷的方式差不多,也將行為意圖作為顯式標(biāo)識(shí),通過(guò)多目標(biāo)軌跡回歸進(jìn)行建模。前提是需要在一定時(shí)序內(nèi)創(chuàng)建客體(其他車(chē)或行人)ID一致性標(biāo)簽。防止跳幀、丟失客體觀察。
這就引出了第二個(gè)理由,成本問(wèn)題。長(zhǎng)時(shí)幀的標(biāo)注和ID標(biāo)簽訓(xùn)練成本太高了,大家都鼓吹無(wú)/輕標(biāo)注和無(wú)監(jiān)督學(xué)習(xí),這讓靜止幀訓(xùn)練成了現(xiàn)實(shí)選擇。
長(zhǎng)序列不僅要求高質(zhì)量時(shí)空數(shù)據(jù)樣本,還依賴強(qiáng)化標(biāo)注,大大擴(kuò)張了數(shù)據(jù)量。對(duì)大模型和轉(zhuǎn)移之后的車(chē)端小模型構(gòu)成更多算力壓力。很多品牌已經(jīng)注意到連續(xù)行為數(shù)據(jù)的采集、標(biāo)注與利用。但從這次懂車(chē)帝測(cè)試情況來(lái)看,成果尚未反映到模型訓(xùn)練和轉(zhuǎn)移。
不過(guò),目前業(yè)內(nèi)多品牌的端到端系統(tǒng),比以前更重視“連續(xù)語(yǔ)義行為”的訓(xùn)練,盡量模擬人類隨著時(shí)序所做的連續(xù)決策與執(zhí)行。目標(biāo)是讓系統(tǒng)變得更穩(wěn)健可信,構(gòu)建有清晰合理責(zé)任邊界的系統(tǒng),而不是到關(guān)鍵時(shí)刻自己掉鏈子要求接管的甩鍋系統(tǒng)。
我們應(yīng)該相信,隨著技術(shù)發(fā)展,智駕將越來(lái)越理智,并最終接管人類駕駛。在此之前,還是要謹(jǐn)慎宣傳,避免誤導(dǎo)公眾。
注:圖片部分來(lái)源網(wǎng)絡(luò),如有侵權(quán),聯(lián)系刪除。
克服AI幻覺(jué)?也許在開(kāi)智駕倒車(chē)
2025過(guò)半,整車(chē)市場(chǎng)終局的端倪
小鵬與華為合作,產(chǎn)業(yè)新動(dòng)向
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.