解析丨自動駕駛核心技術:感知,決策與執行(上:感知篇)

解析丨自動駕駛核心技術:感知,決策與執行(上:感知篇)
隨着汽車智能化、電子化的推動,自動駕駛已經成爲將來汽車發展的主流趨勢之一。
算法

圍繞自動駕駛關鍵技術體系研究,實現公開道路實地測試以及商業化應用是當下行業關注的重點。安全

簡單來講,實現自動駕駛須要解決三個核心問題:「我在哪?我要去哪?我該如何去?」能完整解決這三個問題就是真正的自動駕駛。網絡

目前,自動駕駛汽車關鍵技術主要包括環境感知、精準定位、決策與規劃、控制與執行、高精地圖與車聯網V2X以及自動駕駛汽車測試與驗證技術等。併發

在這套技術體系以及關鍵軟硬件設備的支持下,自動駕駛汽車可經過車載攝像機、激光雷達、毫米波雷達、超聲波等傳感器來感知周圍環境,實時動態監測周邊環境變化,並依據所獲取的信息進行決策判斷,造成安全合理的路徑規劃。在規劃好路徑以後,汽車執行系統會控制車輛沿着規劃好的路徑完成駕駛。ide

這套自動駕駛核心技術體系可簡單歸納爲「感知、決策與執行」。
解析丨自動駕駛核心技術:感知,決策與執行(上:感知篇)
感知、決策與執行(圖片來源:方象知產研究院)

測試

感知系統也被稱爲「中層控制系統」,負責感知周圍的環境,並進行環境信息與車內信息的採集與處理,主要涉及道路邊界監測、車輛檢測、行人檢測等技術。編碼

決策系統也被稱爲「上層控制系統」,負責路徑規劃和導航,經過執行相應控制策略,代替人類作出駕駛決策。人工智能

執行系統也被稱爲「底層控制系統」,負責汽車的加速、剎車和轉向,主要由電子制動、電子驅動以及電子轉向三部分構成。.net

經過「感知、決策與執行」三個系統的分工協做,責任明確地控制汽車運行,能夠令自動駕駛汽車具有理論上「自動行駛」的條件。
解析丨自動駕駛核心技術:感知,決策與執行(上:感知篇)
自動駕駛汽車經常使用的各類硬件(圖片來源:見參考資料1)

3d

本文將從感知、決策與執行三個角度,詳細介紹自動駕駛的核心技術體系。

1、感知篇

實現自動駕駛,須要優先解決一個問題:行車安全。

爲了確保自動駕駛車輛在不一樣場景下都可以作出正確判斷,須要實現對周圍環境信息的實時動態獲取和識別,這些信息包括但不限於自車的狀態、交通流信息、道路情況、交通標誌等,以知足車輛決策系統的需求。

換言之,環境感知起着相似人類駕駛員「眼睛」、「耳朵」的做用,是實現自動駕駛的前提條件。

爲了知足環境感知的需求,自動駕駛汽車每每裝備了諸多攝像機、激光雷達、毫米波雷達、超聲波等車載傳感器,在這些傳感器以及V2X和5G網絡技術的協做下,能夠實時獲取汽車所處的交通環境和車輛狀態等多源信息,爲自動駕駛汽車的決策規劃提供支持服務。

目前,環境感知技術有兩種技術路線,一種是以攝像機爲主導的多傳感器融合方案,典型表明是特斯拉。另外一種是以激光雷達爲主導,其餘傳感器爲輔助的技術方案,典型企業表明如谷歌、百度等。
解析丨自動駕駛核心技術:感知,決策與執行(上:感知篇)
主流車載傳感器的特色(圖片來源:36氪)

Ξ 1.攝像機

車載攝像機是實現衆多預警、識別類ADAS功能的基礎,是目前最便宜也是最經常使用的車載傳感器之一。
解析丨自動駕駛核心技術:感知,決策與執行(上:感知篇)
百度Apollo自動駕駛攝像機組件

攝像機能夠識別車輛行駛環境中的車輛、行人、車道線、路標、交通標誌、交通訊號燈等,具備較高的圖像穩定性、抗干擾能力和傳輸能力。

做爲一種比較常見的車載傳感器,攝像機的優勢是能夠分辨顏色,比較適用於場景解讀。可是其也有比較明顯的缺點。

首先攝像機缺少「深度」這一維度,沒有立體視覺,沒法判斷物體和相機間的距離;其次,攝像機對光線較爲敏感,過暗或過強的光線以及兩者之間的快速切變都會對其成像形成嚴重影響。

根據鏡頭和佈置方式的不一樣,攝像機可大體分爲四種:單目攝像機、雙目攝像機、三目攝像機和環視攝像機。

單目攝像機主要用於自動駕駛過程當中的路況判斷,但單目攝像機在測距範圍與距離方面,有一個不可調和的矛盾:攝像機的視角越寬,所能探測到精準距離的長度越短;視角越窄,探測到的距離越長。

這與人眼相似,看遠處的時候,所能覆蓋的範圍就窄,看近處的時候,覆蓋的範圍就會廣一些。

爲了解決這個問題,實現用一個定焦鏡頭解決不一樣距離的觀察,雙目甚至多目攝像機的方案,逐漸獲得愈來愈普遍的應用。

雙目攝像機,顧名思義,擁有兩個攝像機組件。相近的兩個攝像機拍攝物體時,會獲得物體像素偏移量、相機焦距和兩個攝像機的實際距離等信息,根據信息便可換算得出物體的距離。

不過,雖然雙目能獲得較高精度的測距結果和提供圖像分割的能力,但它與單目攝像機同樣,鏡頭的視野徹底依賴於鏡頭。並且雙目測距原理對兩個鏡頭的安裝位置和距離要求較多,在相機標定方面存在必定難度。

目前應用比較普遍的是三目攝像機,三個不一樣焦距單目攝像機的組合。咱們以特斯拉Autopilot爲例,下圖爲特斯拉AutoPilot安裝在擋風玻璃下方的三目攝像機:
解析丨自動駕駛核心技術:感知,決策與執行(上:感知篇)
特斯拉AutoPilot的三目攝像機

特斯拉Autopilot總計擁有8個攝像頭、1個前毫米波雷達、12個超聲波雷達的傳感器配置,總體俯視圖視場覆蓋以下:
解析丨自動駕駛核心技術:感知,決策與執行(上:感知篇)
其中三目攝像機的具體配置以下:

FOV35度,最遠距離250米;FOV50度,最遠檢測距離150米;FOV120度,最遠檢測距離60米。

三目攝像機以及其餘位置攝像機的組合爲特斯拉Autopilot提供了全向的環境感知能力,較好地解決了感知範圍與感知精度的問題。

除了單目與多目攝像機之外,還有一種比較常見的攝像機類型,即環視攝像機。與上面提到的三種攝像機不一樣,環視攝像機的鏡頭是魚眼鏡頭,並且安裝位置是朝向地面。

環視攝像機的優勢是視野廣闊,但缺點也很明顯,就是圖像畸變嚴重,因此主要用於車身5-10米內的障礙物檢測、自主泊車時的庫位線識別等。

Ξ 2. 激光雷達

激光雷達是以發射激光束來探測目標空間位置的主動測量設備。在自動駕駛場景中,激光雷達主要有兩個功能:3D的環境感知與SLAM增強定位。

根據探測原理,激光雷達可分爲單線(二維)激光雷達和多線(三維)激光雷達。

單線激光雷達,經過發出一束激光掃描線對區域進行旋轉掃描,並根據區域內各個點與激光雷達的相對空間距離與方位,返回測量值。單線激光雷達的數據缺乏一個維度,只能描述線狀信息,沒法描述面。不過,單線激光雷達是目前成本最低的激光雷達。

多線激光雷達,經過發出兩束或兩束以上的激光掃描線對區域進行旋轉掃描。多線激光雷達可以檢測目標的空間距離與方位,並能夠經過點雲來描述三維環境模型,能夠提供目標的激光反射強度信息,提供被檢測目標的詳細形狀描述。

目前,國際市場上推出的主要有4線、8線、16線、32線和64線。激光雷達發出的線束越多,每秒採集的點雲越多,同時造價也越高。

以激光雷達行業內知名企業Velodyne 公司爲例,旗下的HDL-64E目前的售價在接近10萬美金左右:
解析丨自動駕駛核心技術:感知,決策與執行(上:感知篇)
目前,激光雷達已經發展了三代產品,包括第一代機械掃描激光雷達、第二代混合固態激光雷達以及第三代純固態激光雷達。

整體而言,激光雷達不管是在技術門檻仍是在制形成本上都比較高,自動駕駛商業化應用期待市場出現更多優質且價格較低的同類產品。

Ξ 3. 毫米波雷達

因爲激光雷達價格太高,單獨一個雷達的價格可能遠超車輛自己的價格,所以不少企業選擇使用性價比更高的毫米波雷達做爲測距和測速的傳感器。

毫米波雷達是指工做在毫米波波段,頻率在30—300GHz之間的雷達。與激光波雷達相比,毫米波雷達不只成本更低,且能夠同時解決攝像機測距、測速不夠精確的問題,此外毫米波雷達還能夠完美處理激光雷達所處理不了的沙塵天氣。

不過,毫米波雷達也並非沒有缺點。首先,毫米波雷達的數據穩定性較差,對後續的軟件算法提出了更高的要求。

此外,毫米波雷達對金屬極爲敏感,路面的金屬廣告牌在不少場景下會被認爲是障礙物,致使剎車不斷。最後毫米波雷達只能提供距離和角度信息,不能像激光雷達那樣提供高度信息。
解析丨自動駕駛核心技術:感知,決策與執行(上:感知篇)
百度Apollo自動駕駛毫米波雷達組件

根據測量原理的不一樣,毫米波雷達可分爲脈衝方式毫米波雷達和調頻連續波方式毫米波雷達兩種。

脈衝方式毫米波雷達,其基本原理與激光雷達類似,它在硬件結構上比較複雜、成本較高,不多用於自動駕駛汽車,目前大多數車載毫米波雷達都採用調頻連續波方式。

調頻連續波方式毫米波雷達,具備結構簡單、體積小、成本低廉,容易實現近距離探測。

Ξ 4. 超聲波雷達

超聲波雷達工做在機械波波段,工做頻率在 20kHz以上。

超聲波雷達的工做原理是經過超聲波發射裝置向外發出超聲波,經過接收器接收回波的時間差來測算距離。經常使用的工做頻率有40kHz, 48kHz和58kHz三種。通常來講,頻率越高,靈敏度越高,但水平與垂直方向的探測角度就越小,因此通常採用40kHz的探頭。

超聲波雷達具備頻率高、波長短、繞射現象小、方向性好、可以成爲射線而定向傳播等優勢,且兼具防水、防塵的特性,所以很是適合應用於泊車。

通常狀況下,超聲波雷達會安裝在汽車保險槓上方,隱藏在保險槓的某個位置,以下圖所示:
解析丨自動駕駛核心技術:感知,決策與執行(上:感知篇)
常見的超聲波雷達有兩種。一種是安裝在汽車先後保險槓上,用於測量汽車先後障礙物的倒車雷達,稱之爲UPA;另外一種是安裝在汽車側面,用於測量側方障礙物距離的超聲波雷達,稱之爲APA。UPA和APA的區別還體如今探測範圍和探測區域上。

Ξ 5. 精準定位

自動駕駛汽車的環境感知還包括汽車的精準定位,不只須要獲取車輛與外界環境的相對位置關係,還須要經過車身狀態感知肯定車輛的絕對位置與方位。

目前自動駕駛領域常見的幾種精準定位方式包括「慣性導航系統」、「輪速編碼器與航跡推算」、「衛星導航系統」以及「SLAM自主導航系統」等。

慣性導航系統是以陀螺和加速度計爲敏感器件的導航參數解算系統,經過測量運動載體的線加速度和角速率數據,並將這些數據對時間進行積分運算,從而獲得速度、位置和姿態。

具體來講慣性導航系統屬於一種推算導航方式。即從一已知點的位置根據連續測得的運載體航向角和速度推算出其下一點的位置,於是可連續測出運動體的當前位置。

以百度Apollo自動駕駛技術使用的慣性導航系統爲例,其採用了鬆耦合的方式,並採用了一個偏差Kalman濾波器。

慣性導航解算的結果用於Kalman濾波器的時間更新,即預測;而GNSS、點雲定位結果用於Kalman濾波器的量測更新。Kalman濾波會輸出位置、速度、姿態的偏差用來修正慣導模塊,IMU期間偏差用來補償IMU原始數據。

輪速編碼器與航跡推算的原理是經過輪速編碼器推算出自動駕駛汽車的位置。輪速編碼器主要安裝在汽車前輪,用於記錄車輪行駛的總轉數。

經過分析每一個時間段裏左右輪的轉數,能夠推算出車輛向前行駛的距離和左右的偏轉度。不過,因爲在不一樣地面材質上轉數對距離轉換存在誤差,因此時間越久,測量誤差也會越大,這種定位方式更多以輔助的形式存在。

衛星導航系統主要包括中國的北斗衛星導航系統、美國的GPS衛星導航系統以及俄羅斯的GLONASS衛星導航系統。這些導航系統能夠提供高精度的定位服務。

SLAM(即時定位與地圖構建),也稱爲CML(併發建圖與定位)。

目前主流有兩種SLAM方式。第一種是基於激光雷達的SLAM,以谷歌汽車爲例。車輛攜帶有GPS,經過GPS 對位置進行判斷,並以激光雷達SLAM點雲圖像與高精度地圖進行座標配準,匹配後確認自身位姿。

第二種是基於視覺的SLAM,以Mobileye爲例。Mobileye提出一種無需SLAM的定位方法——REM。車輛經過採集包括信號燈、指示牌等標識,獲得了一個簡單的三維座標數據,再經過視覺識別車道線等信息,獲取一個一維數據。攝像機中的圖像與 REM 地圖中進行配準,便可完成定位。

目前,SLAM經常使用於自主導航,特別是在GPS無信號或不熟悉的地區的導航。

Ξ 6. 高精地圖

高精地圖是用於自動駕駛的專題地圖,由含有語義信息的車道模型、道路部件(Object)、道路屬性三類矢量信息,以及用於多傳感器定位的特徵(feature)圖層構成。

高精地圖擁有精確的車輛位置信息和豐富的道路元素數據信息,起到構建相似於人腦對於空間的總體記憶與認知的功能,能夠幫助汽車預知路面複雜信息,如坡度、曲率、航向等,更好地規避潛在的風險,是自動駕駛汽車的核心技術之一。

相較於GPS導航系統的傳統地圖而言,高精地圖最顯著的特徵是其表徵路面特徵的精準性。關於高精地圖的詳細內容,咱們會在後面的文章中詳細介紹。

未完待續...

參考資料:

  1. Development of Steering Control System for Autonomous Vehicle Using Geometry-Based Path Tracking Algorithm

2.AMiner《2018年人工智能之自動駕駛研究報告》

3.【感知】自動駕駛傳感器匯

(https://blog.csdn.net/yuxuan20062007/article/details/83862525)

4.Apollo官網

5.Velodyne官網

6.36氪《自動駕駛行業研究報告》

相關文章
相關標籤/搜索