網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

自動(dòng)駕駛汽車如何識(shí)別懸空物體？

2026-04-02 09:03:22　來(lái)源: 智駕最前沿

江蘇舉報(bào)

分享至

[首發(fā)于智駕最前沿微信公眾號(hào)]不知道大家是否遇到過(guò)被風(fēng)吹歪的樹(shù)、斜插在路中央的路燈桿，或者一簇從路邊低垂下來(lái)的茂密樹(shù)枝這類的場(chǎng)景。對(duì)于人類駕駛員來(lái)說(shuō)，一眼就能看出這些物體是否會(huì)擋住去路，但對(duì)于完全依賴傳感器的自動(dòng)駕駛汽車而言，識(shí)別這些空間中的懸空物體卻是一個(gè)極其復(fù)雜的過(guò)程。

圖片源自：網(wǎng)絡(luò)

這些物體不與地面直接相連，或者其主體部分位于傳感器常規(guī)掃描范圍的邊緣，很容易被算法誤認(rèn)為是背景噪聲或者是可以安全通過(guò)的虛警信號(hào)。那自動(dòng)駕駛汽車是如何識(shí)別懸空物體的？

激光雷達(dá)的避障原理

激光雷達(dá)作為自動(dòng)駕駛汽車的“深度眼睛”，是識(shí)別懸空物體最得力的工具。其通過(guò)不斷發(fā)射激光脈沖，并計(jì)算這些脈沖碰到物體后返回的時(shí)間，可以精準(zhǔn)地測(cè)算出物體與車之間的距離。

當(dāng)成千上萬(wàn)個(gè)激光點(diǎn)打在周圍環(huán)境上時(shí)，系統(tǒng)就能獲得一個(gè)密集的“點(diǎn)云圖”。不同于普通照片的扁平，點(diǎn)云圖是三維的，它記錄了每一個(gè)點(diǎn)在空間中的確切坐標(biāo)，包括高度信息。這意味著，當(dāng)激光打在橫跨道路的樹(shù)枝或歪斜的燈桿上時(shí)，系統(tǒng)能立刻感知到這些物體的幾何輪廓和它們距離地面的高度。

在實(shí)際行駛過(guò)程中，系統(tǒng)首先要解決的是“如何把地面撇開(kāi)”的問(wèn)題。激光雷達(dá)采集到的數(shù)據(jù)極其龐大，其中絕大部分是平坦的路面。為了讓懸空物體顯現(xiàn)出來(lái)，系統(tǒng)會(huì)運(yùn)行“地面過(guò)濾”的算法。

這種算法會(huì)分析點(diǎn)云的垂直高度差異，將符合地面特征的點(diǎn)云去除，剩下的就是那些凸起于地面的障礙物。對(duì)于像樹(shù)枝這樣形狀不規(guī)則的物體，系統(tǒng)會(huì)利用多幀點(diǎn)云疊加的技術(shù)，通過(guò)車輛在行駛過(guò)程中的位置移動(dòng)，從多個(gè)角度給物體“拍照”，從而拼湊出它在空中的準(zhǔn)確形狀和體積。

圖片源自：網(wǎng)絡(luò)

除了形狀，激光雷達(dá)還可以“反射強(qiáng)度”。不同材質(zhì)的物體對(duì)激光的反射效率是不一樣的。路燈桿是金屬材質(zhì)，它的反射率非常高且穩(wěn)定；而樹(shù)葉含有水分，表面粗糙，反射回來(lái)的信號(hào)則相對(duì)雜亂且微弱。

通過(guò)分析反射強(qiáng)度的差異，自動(dòng)駕駛系統(tǒng)可以初步判斷前面的障礙物到底是不可觸碰的金屬桿，還是可以輕微擦碰的軟樹(shù)葉。對(duì)于那些極細(xì)的樹(shù)枝，雖然單個(gè)激光點(diǎn)可能難以捕捉到完整的輪廓，但通過(guò)如隨機(jī)采樣一致性方法等特殊的線段擬合算法，系統(tǒng)能夠從零散的干擾點(diǎn)中識(shí)別出具有一定直徑和長(zhǎng)度的線性結(jié)構(gòu)，從而預(yù)判出那是樹(shù)木的延伸。

當(dāng)然，激光雷達(dá)也有它的局限性。隨著探測(cè)距離的增加，激光點(diǎn)會(huì)變得越來(lái)越稀疏。一個(gè)遠(yuǎn)處的路燈桿可能只被一個(gè)激光點(diǎn)掃到，這給判斷帶來(lái)了難度。

但自動(dòng)駕駛汽車通常會(huì)將激光雷達(dá)安裝在車頂?shù)淖罡咛帲ㄟ^(guò)向下傾斜的掃描角度，確保對(duì)車輛前方的上方空間實(shí)現(xiàn)全覆蓋。

通過(guò)這種俯瞰視角，車輛可以在進(jìn)入危險(xiǎn)區(qū)域之前的幾百米外，就通過(guò)稀疏的點(diǎn)云預(yù)警到上方可能存在的高度障礙。

毫米波雷達(dá)的避障原理

毫米波雷達(dá)通過(guò)發(fā)射無(wú)線電波來(lái)探測(cè)物體的速度和距離，而且它幾乎不受大雨、濃霧或黑夜的影響。然而，傳統(tǒng)的毫米波雷達(dá)缺乏“俯仰角”的分辨力。

簡(jiǎn)單來(lái)說(shuō)，它能感覺(jué)到前面有個(gè)東西，但它很難分清楚這個(gè)東西是停在路面上的一輛壞車，還是懸在半空中的一塊交通指示牌。

這種高度感知能力的缺失，曾經(jīng)導(dǎo)致過(guò)很多自動(dòng)駕駛系統(tǒng)的“幽靈剎車”事故，也就是車子突然對(duì)著空無(wú)一物的路面或者高處的路牌猛踩剎車的原因。

為了攻克這個(gè)難題，4D成像雷達(dá)技術(shù)應(yīng)運(yùn)而生。這里的“4D”指的是在原有的距離、速度、方位角基礎(chǔ)上，增加了第四個(gè)維度，即高度。通過(guò)引入更多數(shù)量的天線陣列和更先進(jìn)的數(shù)字信號(hào)處理算法，4D成像雷達(dá)能夠像激光雷達(dá)一樣產(chǎn)生具有垂直分辨率的點(diǎn)云。

當(dāng)車輛駛向一個(gè)歪斜的路燈或者是低矮的立交橋時(shí)，4D雷達(dá)能夠清晰地測(cè)出這些物體底部到地面的凈空高度。如果這個(gè)高度大于車輛自身的高度加上安全余量，決策系統(tǒng)就會(huì)知道那是可以安全通過(guò)的，從而避免了不必要的驚慌剎車。

圖片源自：網(wǎng)絡(luò)

4D成像雷達(dá)對(duì)物體運(yùn)動(dòng)狀態(tài)也可以敏銳觀察。通過(guò)微多普勒效應(yīng)，雷達(dá)可以捕捉到物體表面極其細(xì)微的顫動(dòng)。像是風(fēng)吹動(dòng)樹(shù)枝時(shí)的搖擺，或者是電線桿在氣流中的細(xì)微共振，這些動(dòng)態(tài)特征在雷達(dá)信號(hào)中都有獨(dú)特的表現(xiàn)。

相比之下，停在路邊的靜止車輛或固定在地面上的障礙物，其信號(hào)表現(xiàn)則完全不同。利用這些細(xì)微的物理特性，系統(tǒng)能夠?qū)铱盏淖匀痪拔锱c人造的結(jié)構(gòu)件區(qū)分開(kāi)來(lái)，極大地提升了識(shí)別的準(zhǔn)確度。

此外，由于無(wú)線電波在金屬物體上的反射極其強(qiáng)烈，而在植物葉片上的反射較弱，雷達(dá)系統(tǒng)通過(guò)計(jì)算回波的能量強(qiáng)度，也能輔助判斷物體的硬度。當(dāng)一個(gè)歪斜的金屬燈桿出現(xiàn)在路徑上時(shí)，雷達(dá)會(huì)收到一個(gè)非常強(qiáng)且集中的反饋信號(hào)；而當(dāng)它遇到樹(shù)枝時(shí)，信號(hào)則會(huì)顯得破碎且分散。

這種對(duì)物體“質(zhì)地”的感應(yīng)，為自動(dòng)駕駛汽車在復(fù)雜的城市場(chǎng)景中提供了一層額外的安全冗余。即便是激光雷達(dá)因?yàn)榇箪F失效，4D成像雷達(dá)依然能守住最后一道防線，確保車輛不會(huì)一頭撞向那些懸掛在高處的硬質(zhì)物體。

占據(jù)網(wǎng)格技術(shù)幫汽車?yán)斫鈴?fù)雜形狀？

除了激光雷達(dá)和毫米波雷達(dá)，自動(dòng)駕駛汽車還配備了大量的攝像頭。傳統(tǒng)的視覺(jué)識(shí)別方法主要依賴于“目標(biāo)檢測(cè)”，也就是給照片里的物體畫框。

但是，這種畫框的方法在面對(duì)懸空物體時(shí)會(huì)失靈。這是因?yàn)橐豢么孤涞牧鴺?shù)或者一根不規(guī)則傾斜的電線桿，很難用一個(gè)規(guī)整的方框來(lái)準(zhǔn)確描述它們?cè)诳臻g中的實(shí)際位置。

為了更真實(shí)地還原世界，一種被稱為“占據(jù)網(wǎng)格預(yù)測(cè)”或者“占據(jù)網(wǎng)絡(luò)”的技術(shù)正在成為主流。

這種技術(shù)不再糾結(jié)于“這個(gè)物體叫什么”，而是把汽車周圍的空間切割成千上萬(wàn)個(gè)微小的正方體格子，也就是所謂的“體素”。系統(tǒng)通過(guò)深度學(xué)習(xí)模型去預(yù)測(cè)每一個(gè)格子是被物體占據(jù)了，還是空出來(lái)的。

圖片源自：網(wǎng)絡(luò)

對(duì)于懸空物體來(lái)說(shuō)，這種方法簡(jiǎn)直是量身定做的。即使是一個(gè)形狀極其復(fù)雜、半垂半懸的樹(shù)枝，系統(tǒng)也能通過(guò)攝像頭捕捉到的多角度畫面，計(jì)算出它在三維空間中到底占用了哪些格子。

這樣一來(lái)，車輛的路徑規(guī)劃器會(huì)尋找一條完全由“空閑格子”組成的路徑，從而巧妙地從懸空物體的下方或側(cè)面繞過(guò)去。

在占據(jù)網(wǎng)格的體系下，視覺(jué)系統(tǒng)能夠捕捉到極其細(xì)微的語(yǔ)義信息。通過(guò)對(duì)圖像像素的逐個(gè)分析，攝像頭可以識(shí)別出哪些格子屬于“植被”，哪些屬于“交通設(shè)施”。

當(dāng)車輛面對(duì)歪斜的路燈時(shí)，視覺(jué)系統(tǒng)能識(shí)別出其金屬頂部的紋理和結(jié)構(gòu)特征，并將其標(biāo)記為不可逾越的剛性障礙物。而當(dāng)面對(duì)樹(shù)枝時(shí)，如果占據(jù)網(wǎng)格顯示這些格子的分布非常稀疏，且語(yǔ)義標(biāo)簽顯示為“樹(shù)葉”，系統(tǒng)可能會(huì)將其風(fēng)險(xiǎn)權(quán)重調(diào)低，認(rèn)為即使發(fā)生輕微觸碰也不會(huì)產(chǎn)生嚴(yán)重后果。

視覺(jué)系統(tǒng)還可利用“視差”原理來(lái)增強(qiáng)對(duì)高度的感知。就像人類用兩只眼睛看東西能分辨遠(yuǎn)近一樣，自動(dòng)駕駛汽車通過(guò)多顆不同位置的攝像頭，可以計(jì)算出同一個(gè)物體在不同畫面里的位置偏差。

對(duì)于懸空物體，這種視差變化非常明顯。當(dāng)汽車行駛時(shí)，距離較近的懸空樹(shù)枝在畫面中移動(dòng)的速度遠(yuǎn)快于遠(yuǎn)處的背景。

通過(guò)這種動(dòng)態(tài)的視覺(jué)信息，系統(tǒng)能夠?qū)崟r(shí)更新物體在三維空間中的位置和高度，這種能力在缺乏高精度地圖支持的區(qū)域尤為關(guān)鍵，它讓汽車具備了“邊走邊看邊想”的自主判斷能力。

面對(duì)不同材質(zhì)的障礙物時(shí)汽車該如何做出決策？

識(shí)別出物體只是第一步，更難的是決定“怎么辦”。決策規(guī)劃系統(tǒng)需要根據(jù)傳感器收集到的所有信息，對(duì)懸空物體的威脅程度進(jìn)行分級(jí)。這里涉及到一個(gè)非常核心的邏輯，即剛性物體與柔性物體的區(qū)分。

歪斜的路燈桿是典型的剛性障礙物，它的直徑、材質(zhì)和位置決定了車輛絕對(duì)不能與其發(fā)生接觸。而樹(shù)枝則情況復(fù)雜，它們可能是柔軟的細(xì)枝，也可能是足以撞壞前擋風(fēng)玻璃的粗壯干枯分支。

為了做出準(zhǔn)確判斷，系統(tǒng)會(huì)采用“多傳感器融合”的機(jī)制。

圖片源自：網(wǎng)絡(luò)

想象這樣一個(gè)場(chǎng)景，車頭前方的攝像頭識(shí)別出了一些綠色的葉子，激光雷達(dá)測(cè)算出這些葉子距離地面約兩米高，而毫米波雷達(dá)卻幾乎沒(méi)有探測(cè)到強(qiáng)烈的反射信號(hào)。綜合這些信息，系統(tǒng)會(huì)得出一個(gè)結(jié)論，這大概率是一簇低垂的軟樹(shù)枝，不會(huì)對(duì)行車安全造成實(shí)質(zhì)性威脅。

但如果激光雷達(dá)和雷達(dá)同時(shí)在那個(gè)高度探測(cè)到了強(qiáng)烈的信號(hào)，且視覺(jué)系統(tǒng)識(shí)別出了灰色的金屬質(zhì)感，系統(tǒng)則會(huì)立刻將其判定為危險(xiǎn)物體，并在規(guī)劃路徑時(shí)將其設(shè)為絕對(duì)禁區(qū)。

針對(duì)那些半遮半掩的枝叢狀物體，系統(tǒng)還會(huì)利用特定的算法來(lái)評(píng)估它們的“穿透性”。在一些極端的越野或者鄉(xiāng)村路況中，車輛可能不得不穿過(guò)一些茂密的植被。

此時(shí)，系統(tǒng)會(huì)分析激光雷達(dá)回波的穿透率。如果激光能夠輕易穿過(guò)物體打到后面的背景上，說(shuō)明物體非常稀疏；如果激光全部被擋住，說(shuō)明物體非常結(jié)實(shí)。這種基于物理特性的判斷，使得汽車在決策時(shí)不僅僅是在做簡(jiǎn)單的避障，而是在進(jìn)行復(fù)雜的環(huán)境風(fēng)險(xiǎn)評(píng)估。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.