[首發(fā)于智駕最前沿微信公眾號(hào)]不知道大家是否遇到過(guò)被風(fēng)吹歪的樹(shù)、斜插在路中央的路燈桿,或者一簇從路邊低垂下來(lái)的茂密樹(shù)枝這類的場(chǎng)景。對(duì)于人類駕駛員來(lái)說(shuō),一眼就能看出這些物體是否會(huì)擋住去路,但對(duì)于完全依賴傳感器的自動(dòng)駕駛汽車而言,識(shí)別這些空間中的懸空物體卻是一個(gè)極其復(fù)雜的過(guò)程。
圖片源自:網(wǎng)絡(luò)
這些物體不與地面直接相連,或者其主體部分位于傳感器常規(guī)掃描范圍的邊緣,很容易被算法誤認(rèn)為是背景噪聲或者是可以安全通過(guò)的虛警信號(hào)。那自動(dòng)駕駛汽車是如何識(shí)別懸空物體的?
激光雷達(dá)的避障原理
激光雷達(dá)作為自動(dòng)駕駛汽車的“深度眼睛”,是識(shí)別懸空物體最得力的工具。其通過(guò)不斷發(fā)射激光脈沖,并計(jì)算這些脈沖碰到物體后返回的時(shí)間,可以精準(zhǔn)地測(cè)算出物體與車之間的距離。
當(dāng)成千上萬(wàn)個(gè)激光點(diǎn)打在周圍環(huán)境上時(shí),系統(tǒng)就能獲得一個(gè)密集的“點(diǎn)云圖”。不同于普通照片的扁平,點(diǎn)云圖是三維的,它記錄了每一個(gè)點(diǎn)在空間中的確切坐標(biāo),包括高度信息。這意味著,當(dāng)激光打在橫跨道路的樹(shù)枝或歪斜的燈桿上時(shí),系統(tǒng)能立刻感知到這些物體的幾何輪廓和它們距離地面的高度。
在實(shí)際行駛過(guò)程中,系統(tǒng)首先要解決的是“如何把地面撇開(kāi)”的問(wèn)題。激光雷達(dá)采集到的數(shù)據(jù)極其龐大,其中絕大部分是平坦的路面。為了讓懸空物體顯現(xiàn)出來(lái),系統(tǒng)會(huì)運(yùn)行“地面過(guò)濾”的算法。
這種算法會(huì)分析點(diǎn)云的垂直高度差異,將符合地面特征的點(diǎn)云去除,剩下的就是那些凸起于地面的障礙物。對(duì)于像樹(shù)枝這樣形狀不規(guī)則的物體,系統(tǒng)會(huì)利用多幀點(diǎn)云疊加的技術(shù),通過(guò)車輛在行駛過(guò)程中的位置移動(dòng),從多個(gè)角度給物體“拍照”,從而拼湊出它在空中的準(zhǔn)確形狀和體積。
圖片源自:網(wǎng)絡(luò)
除了形狀,激光雷達(dá)還可以“反射強(qiáng)度”。不同材質(zhì)的物體對(duì)激光的反射效率是不一樣的。路燈桿是金屬材質(zhì),它的反射率非常高且穩(wěn)定;而樹(shù)葉含有水分,表面粗糙,反射回來(lái)的信號(hào)則相對(duì)雜亂且微弱。
通過(guò)分析反射強(qiáng)度的差異,自動(dòng)駕駛系統(tǒng)可以初步判斷前面的障礙物到底是不可觸碰的金屬桿,還是可以輕微擦碰的軟樹(shù)葉。對(duì)于那些極細(xì)的樹(shù)枝,雖然單個(gè)激光點(diǎn)可能難以捕捉到完整的輪廓,但通過(guò)如隨機(jī)采樣一致性方法等特殊的線段擬合算法,系統(tǒng)能夠從零散的干擾點(diǎn)中識(shí)別出具有一定直徑和長(zhǎng)度的線性結(jié)構(gòu),從而預(yù)判出那是樹(shù)木的延伸。
當(dāng)然,激光雷達(dá)也有它的局限性。隨著探測(cè)距離的增加,激光點(diǎn)會(huì)變得越來(lái)越稀疏。一個(gè)遠(yuǎn)處的路燈桿可能只被一個(gè)激光點(diǎn)掃到,這給判斷帶來(lái)了難度。
但自動(dòng)駕駛汽車通常會(huì)將激光雷達(dá)安裝在車頂?shù)淖罡咛帲ㄟ^(guò)向下傾斜的掃描角度,確保對(duì)車輛前方的上方空間實(shí)現(xiàn)全覆蓋。
通過(guò)這種俯瞰視角,車輛可以在進(jìn)入危險(xiǎn)區(qū)域之前的幾百米外,就通過(guò)稀疏的點(diǎn)云預(yù)警到上方可能存在的高度障礙。
毫米波雷達(dá)的避障原理
毫米波雷達(dá)通過(guò)發(fā)射無(wú)線電波來(lái)探測(cè)物體的速度和距離,而且它幾乎不受大雨、濃霧或黑夜的影響。然而,傳統(tǒng)的毫米波雷達(dá)缺乏“俯仰角”的分辨力。
簡(jiǎn)單來(lái)說(shuō),它能感覺(jué)到前面有個(gè)東西,但它很難分清楚這個(gè)東西是停在路面上的一輛壞車,還是懸在半空中的一塊交通指示牌。
這種高度感知能力的缺失,曾經(jīng)導(dǎo)致過(guò)很多自動(dòng)駕駛系統(tǒng)的“幽靈剎車”事故,也就是車子突然對(duì)著空無(wú)一物的路面或者高處的路牌猛踩剎車的原因。
為了攻克這個(gè)難題,4D成像雷達(dá)技術(shù)應(yīng)運(yùn)而生。這里的“4D”指的是在原有的距離、速度、方位角基礎(chǔ)上,增加了第四個(gè)維度,即高度。通過(guò)引入更多數(shù)量的天線陣列和更先進(jìn)的數(shù)字信號(hào)處理算法,4D成像雷達(dá)能夠像激光雷達(dá)一樣產(chǎn)生具有垂直分辨率的點(diǎn)云。
當(dāng)車輛駛向一個(gè)歪斜的路燈或者是低矮的立交橋時(shí),4D雷達(dá)能夠清晰地測(cè)出這些物體底部到地面的凈空高度。如果這個(gè)高度大于車輛自身的高度加上安全余量,決策系統(tǒng)就會(huì)知道那是可以安全通過(guò)的,從而避免了不必要的驚慌剎車。
圖片源自:網(wǎng)絡(luò)
4D成像雷達(dá)對(duì)物體運(yùn)動(dòng)狀態(tài)也可以敏銳觀察。通過(guò)微多普勒效應(yīng),雷達(dá)可以捕捉到物體表面極其細(xì)微的顫動(dòng)。像是風(fēng)吹動(dòng)樹(shù)枝時(shí)的搖擺,或者是電線桿在氣流中的細(xì)微共振,這些動(dòng)態(tài)特征在雷達(dá)信號(hào)中都有獨(dú)特的表現(xiàn)。
相比之下,停在路邊的靜止車輛或固定在地面上的障礙物,其信號(hào)表現(xiàn)則完全不同。利用這些細(xì)微的物理特性,系統(tǒng)能夠?qū)铱盏淖匀痪拔锱c人造的結(jié)構(gòu)件區(qū)分開(kāi)來(lái),極大地提升了識(shí)別的準(zhǔn)確度。
此外,由于無(wú)線電波在金屬物體上的反射極其強(qiáng)烈,而在植物葉片上的反射較弱,雷達(dá)系統(tǒng)通過(guò)計(jì)算回波的能量強(qiáng)度,也能輔助判斷物體的硬度。當(dāng)一個(gè)歪斜的金屬燈桿出現(xiàn)在路徑上時(shí),雷達(dá)會(huì)收到一個(gè)非常強(qiáng)且集中的反饋信號(hào);而當(dāng)它遇到樹(shù)枝時(shí),信號(hào)則會(huì)顯得破碎且分散。
這種對(duì)物體“質(zhì)地”的感應(yīng),為自動(dòng)駕駛汽車在復(fù)雜的城市場(chǎng)景中提供了一層額外的安全冗余。即便是激光雷達(dá)因?yàn)榇箪F失效,4D成像雷達(dá)依然能守住最后一道防線,確保車輛不會(huì)一頭撞向那些懸掛在高處的硬質(zhì)物體。
占據(jù)網(wǎng)格技術(shù)幫汽車?yán)斫鈴?fù)雜形狀?
除了激光雷達(dá)和毫米波雷達(dá),自動(dòng)駕駛汽車還配備了大量的攝像頭。傳統(tǒng)的視覺(jué)識(shí)別方法主要依賴于“目標(biāo)檢測(cè)”,也就是給照片里的物體畫框。
但是,這種畫框的方法在面對(duì)懸空物體時(shí)會(huì)失靈。這是因?yàn)橐豢么孤涞牧鴺?shù)或者一根不規(guī)則傾斜的電線桿,很難用一個(gè)規(guī)整的方框來(lái)準(zhǔn)確描述它們?cè)诳臻g中的實(shí)際位置。
為了更真實(shí)地還原世界,一種被稱為“占據(jù)網(wǎng)格預(yù)測(cè)”或者“占據(jù)網(wǎng)絡(luò)”的技術(shù)正在成為主流。
這種技術(shù)不再糾結(jié)于“這個(gè)物體叫什么”,而是把汽車周圍的空間切割成千上萬(wàn)個(gè)微小的正方體格子,也就是所謂的“體素”。系統(tǒng)通過(guò)深度學(xué)習(xí)模型去預(yù)測(cè)每一個(gè)格子是被物體占據(jù)了,還是空出來(lái)的。
圖片源自:網(wǎng)絡(luò)
對(duì)于懸空物體來(lái)說(shuō),這種方法簡(jiǎn)直是量身定做的。即使是一個(gè)形狀極其復(fù)雜、半垂半懸的樹(shù)枝,系統(tǒng)也能通過(guò)攝像頭捕捉到的多角度畫面,計(jì)算出它在三維空間中到底占用了哪些格子。
這樣一來(lái),車輛的路徑規(guī)劃器會(huì)尋找一條完全由“空閑格子”組成的路徑,從而巧妙地從懸空物體的下方或側(cè)面繞過(guò)去。
在占據(jù)網(wǎng)格的體系下,視覺(jué)系統(tǒng)能夠捕捉到極其細(xì)微的語(yǔ)義信息。通過(guò)對(duì)圖像像素的逐個(gè)分析,攝像頭可以識(shí)別出哪些格子屬于“植被”,哪些屬于“交通設(shè)施”。
當(dāng)車輛面對(duì)歪斜的路燈時(shí),視覺(jué)系統(tǒng)能識(shí)別出其金屬頂部的紋理和結(jié)構(gòu)特征,并將其標(biāo)記為不可逾越的剛性障礙物。而當(dāng)面對(duì)樹(shù)枝時(shí),如果占據(jù)網(wǎng)格顯示這些格子的分布非常稀疏,且語(yǔ)義標(biāo)簽顯示為“樹(shù)葉”,系統(tǒng)可能會(huì)將其風(fēng)險(xiǎn)權(quán)重調(diào)低,認(rèn)為即使發(fā)生輕微觸碰也不會(huì)產(chǎn)生嚴(yán)重后果。
視覺(jué)系統(tǒng)還可利用“視差”原理來(lái)增強(qiáng)對(duì)高度的感知。就像人類用兩只眼睛看東西能分辨遠(yuǎn)近一樣,自動(dòng)駕駛汽車通過(guò)多顆不同位置的攝像頭,可以計(jì)算出同一個(gè)物體在不同畫面里的位置偏差。
對(duì)于懸空物體,這種視差變化非常明顯。當(dāng)汽車行駛時(shí),距離較近的懸空樹(shù)枝在畫面中移動(dòng)的速度遠(yuǎn)快于遠(yuǎn)處的背景。
通過(guò)這種動(dòng)態(tài)的視覺(jué)信息,系統(tǒng)能夠?qū)崟r(shí)更新物體在三維空間中的位置和高度,這種能力在缺乏高精度地圖支持的區(qū)域尤為關(guān)鍵,它讓汽車具備了“邊走邊看邊想”的自主判斷能力。
面對(duì)不同材質(zhì)的障礙物時(shí)汽車該如何做出決策?
識(shí)別出物體只是第一步,更難的是決定“怎么辦”。決策規(guī)劃系統(tǒng)需要根據(jù)傳感器收集到的所有信息,對(duì)懸空物體的威脅程度進(jìn)行分級(jí)。這里涉及到一個(gè)非常核心的邏輯,即剛性物體與柔性物體的區(qū)分。
歪斜的路燈桿是典型的剛性障礙物,它的直徑、材質(zhì)和位置決定了車輛絕對(duì)不能與其發(fā)生接觸。而樹(shù)枝則情況復(fù)雜,它們可能是柔軟的細(xì)枝,也可能是足以撞壞前擋風(fēng)玻璃的粗壯干枯分支。
為了做出準(zhǔn)確判斷,系統(tǒng)會(huì)采用“多傳感器融合”的機(jī)制。
圖片源自:網(wǎng)絡(luò)
想象這樣一個(gè)場(chǎng)景,車頭前方的攝像頭識(shí)別出了一些綠色的葉子,激光雷達(dá)測(cè)算出這些葉子距離地面約兩米高,而毫米波雷達(dá)卻幾乎沒(méi)有探測(cè)到強(qiáng)烈的反射信號(hào)。綜合這些信息,系統(tǒng)會(huì)得出一個(gè)結(jié)論,這大概率是一簇低垂的軟樹(shù)枝,不會(huì)對(duì)行車安全造成實(shí)質(zhì)性威脅。
但如果激光雷達(dá)和雷達(dá)同時(shí)在那個(gè)高度探測(cè)到了強(qiáng)烈的信號(hào),且視覺(jué)系統(tǒng)識(shí)別出了灰色的金屬質(zhì)感,系統(tǒng)則會(huì)立刻將其判定為危險(xiǎn)物體,并在規(guī)劃路徑時(shí)將其設(shè)為絕對(duì)禁區(qū)。
針對(duì)那些半遮半掩的枝叢狀物體,系統(tǒng)還會(huì)利用特定的算法來(lái)評(píng)估它們的“穿透性”。在一些極端的越野或者鄉(xiāng)村路況中,車輛可能不得不穿過(guò)一些茂密的植被。
此時(shí),系統(tǒng)會(huì)分析激光雷達(dá)回波的穿透率。如果激光能夠輕易穿過(guò)物體打到后面的背景上,說(shuō)明物體非常稀疏;如果激光全部被擋住,說(shuō)明物體非常結(jié)實(shí)。這種基于物理特性的判斷,使得汽車在決策時(shí)不僅僅是在做簡(jiǎn)單的避障,而是在進(jìn)行復(fù)雜的環(huán)境風(fēng)險(xiǎn)評(píng)估。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.