轉載請註明出處,謝謝
原創做者:Mingrui
原創連接:http://www.javashuo.com/article/p-frztynbt-cy.htmlphp
最近在搞本科畢設,關於基於深度學習的 SLAM 迴環檢測方法。期間,爲了鍛鍊本身的工程實現能力,(也爲了增添畢設的工做量,顯得不那麼水),我本身寫了一個簡單的雙目 SLAM 系統,其中嵌入了一種基於深度學習的輕量級迴環檢測模塊 (https://github.com/rpng/calc),目前這種方法是我找到的最輕量級且效果不錯的迴環檢測方法,固然目前只是暫時使用這種方法,若是我能在畢設期間優化出更好的方法的話,我就把它換掉(大概是不可能的了)。html
選擇雙目是由於雙目比較簡單(不像單目須要不少工做去初始化、估計深度、減少尺度偏差等),整個系統結構比較清晰和簡單,沒有作不少細節上的優化,因此最終效果沒有特別好。但我我的認爲,這樣的結構比較適合 SLAM 的初學者去熟悉一個完整的 SLAM 系統。畢竟若是直接研究 ORB-SLAM2 這種一萬多行代碼、其中嵌入了各類各樣 trick 的複雜系統,對於 SLAM 初學者是很不友好的(心酸淚)。這也是我厚着臉皮開源這個弱雞 SLAM 系統的緣由。前端
本文會對這個系統的架構以及配置安裝方法進行簡單的介紹。本項目的 GitHub 地址:(https://github.com/Mingrui-Yu/A-Simple-Stereo-SLAM-System-with-Deep-Loop-Closing)。以後如有更新還請參考 GitHub 中的 README。git
(https://github.com/gaoxiang12/slambook2/tree/master/ch13)。本系統借鑑了該視覺里程計的基礎架構,前端和後端基本使用了相同的方法。github
(https://github.com/raulmur/ORB_SLAM2)。本系統使用了修改後的 ORB-SLAM2 中提取 ORB 特徵部分 (ORBextractor) 的部分代碼。後端
(https://github.com/rpng/calc)。本系統使用了該方法做爲迴環檢測的方法,並將修改後的代碼嵌入了本系統。網絡
使用 CPU 版本便可。其下載和安裝可參考我總結的教程:(https://github.com/Mingrui-Yu/Tutorials/blob/master/Ubuntu/caffe.md)。其用於迴環檢測。架構
咱們使用了魔改後的 DeepLCD 庫和魔改後的 ORB-SLAM2 中的一點點代碼。這些部分已經包括在項目中,無需另外安裝。app
這裏是一些 SLAM 常規使用內容,具體內容課參照 GitHub 項目中的 README。dom
可能還有漏掉的(emmm),有問題的話歡迎你們 issue。
本項目的 GitHub 地址:(https://github.com/Mingrui-Yu/A-Simple-Stereo-SLAM-System-with-Deep-Loop-Closing)。
完成上述的配置安裝。
clone 本項目:
git clone https://github.com/Mingrui-Yu/A-Simple-Stereo-SLAM-System-with-Deep-Loop-Closing.git
build 本項目:
mkdir build cd build cmake .. make
以後,/bin 文件夾中會有運行程序的可執行文件;/lib 文件夾中會有 libmyslam.so。
目前由於時間緣由(或者僅僅是懶),只寫了雙目 KITTI 的主程序,其位於 /app/run_kitti_stereo。
首先下載 KITTI 數據集, 國內可經過泡泡機器人彙總的百度網盤連接下載。
運行方式:
./bin/run_kitti_stereo config/stereo/gray/KITTI00-02.yaml PATH_TO_DATASET_FOLDER/dataset/sequences/00
其中 KITTI00-02.yaml 是相應參數的配置文件(包括相機參數等),其風格參考 ORB-SLAM2 所提供的配置文件。
另外,在 yaml 配置文件中,有幾個參數能夠控制系統運行時的顯示效果:
軌跡結果展現(挑了效果最好的一次hhh):
下面簡單介紹一下整個系統的架構和原理。
參考 ORB-SLAM2,整個系統分三個線程:前端,後端,迴環閉合。
前端經過特徵點 + 光流法進行追蹤。初始化時,對第一幀左圖提取 ORB feature,使用的是 ORB-SLAM2 中的分格及八叉樹提取方法,由於 OpenCV 中的 ORB 特徵提取有嚴重的分佈不均狀況。注意,與普通特徵點法(例如 ORB-SLAM2)不一樣的是,這裏的 ORB feature 提取沒有使用尺度金字塔,僅僅是在原圖像上進行提取。同時,也不須要計算 feature 的描述子。這兩者是由於,本系統中 feature 的跟蹤不經過特徵匹配,而是基於光流法。
在左圖中提取 ORB feature 後,經過光流法,找到這些 feature 在同幀右圖中的位置。以後,根據一對 feature 在左右目中的位置關係,進行三角測量,獲得其對應的 MapPoint 的深度,並在地圖中建立 MapPoint。同是,根據當前幀建立 KeyFrame,送入到後端中。
以後,每一幀的跟蹤中,會先根據恆速模型,獲得一個當前幀位姿的估計初值。以後,經過光流法,找到上一幀的特 feature 徵點在當前幀的位置,獲得當前幀的 feature 。再根據當前幀的 feature 及 feature 對應的 MapPoints 的位置,經過 g2o 優化獲得當前幀的位姿。此處的優化僅優化當前幀位姿,當前幀觀測到的 MapPoints 僅以約束形式參與優化。若是某個 MapPoints 在剛建立不久(兩幀之內)就成爲 Outlier 了,那麼該 MapPoint 會被從地圖中刪除。
所以,並不須要在每一幀的跟蹤時都提取 feature ,每次僅需經過光流法將上一幀的 feature 關聯到當前幀。但每一次光流跟蹤都會有必定 feature 丟失,只有當前幀的 feature 少於一個閾值時,會再進行 ORB feature 點的提取,此時,會將以前剩餘的 feature 做爲 mask,附近不提取新的 feature 。再經過三角測量獲得新的 MapPoint 並插入地圖。同時,此時會建立 KeyFrame,送入後端。
若是某次追蹤到的特徵點特別特別少,則斷定爲 LOST。目前,系統 LOST 後的 Relocalzation 尚未完成,等我苟過畢設(畢竟寫這玩意跟我畢設主題沒太大關係)。
後端會對一個 active map 進行維護,同時在 active map 中進行優化。前端送入的 KeyFrame,會在後端進行必定的處理,並插入地圖。而 active map 實際上是一個滑動窗口,其中含有必定數量的近期的 KFs 及 它們觀測到的 MapPoints,做爲 active KFs 和 active MapPoints。當一個新的 KF 送入後端時,後端會將它同時插入 map 和 active KFs,並將其觀測到的 MapPoints 插入 active MapPoints。若是此時 active map 中的 KF 數目超過了限制,會從中刪除一個根據條件選擇的 KF。
以後,會在 active map 中進行一次優化,優化包括 active KFs 和 active MapPoints。其中,若是某個 active MapPoints 第一次被觀測到時的 KF 不在 active map 中,那麼它會被固定,僅做爲約束參與優化。優化後被視爲 Outlier 的 MapPoints 會被從地圖中刪除。
另外,新的 KF 會被送入迴環閉合線程。
這一部分相對比較複雜。迴環閉合線程會維護一個 KeyFrame Database,用於迴環檢測。
對於送入迴環閉合線程的新的 KF,首先,會對它進行預處理。第一步,對其 feature 進行擴充和處理。上文說過,前端提取的 feature 不是在尺度金字塔上提取的,而在迴環閉合過程當中,由於須要特徵匹配,因此須要尺度金字塔來克服尺度變化帶來的影響。在這一步中,會基於尺度金字塔,將每一個 feature 擴充成 8(金字塔層數)個 keypoints,即每層的同一位置都視爲一個 keypoint。以後,會對 keyponts 進行篩選:去除其中不能視爲 FAST 角點的(響應低於閾值),以及超出邊界的(由於須要計算描述子、角度等,keypoints 的位置須要離圖像邊界有必定距離)。根據篩選後的 keypoints,計算該 KF 的 ORB 描述子。以上內容是用於特徵匹配的。另外,爲了以後的迴環檢測,預處理中 DeepLCD 中的網絡會對整幅 KF 提取一個描述向量。新的 KF 通過上述處理後,會帶着計算好的描述子和描述向量,被存儲進 KeyFrame Database 中。
迴環檢測:對於每個要查詢是否存在迴環幀(Loop KF)的 Current KF,系統會將 Current KF 與 KeyFrame Database 中全部 KF 的描述向量進行比較,求餘弦類似度做爲類似分數。由於查詢速度至關快,因此此處簡單的使用了線性查詢。 找到類似分數最高的 Candidate KF,若是該類似分數高於一個閾值,則認爲該 Candidate KF 能夠送入下一環節:特徵匹配。
特徵匹配:根據 Candidate KF 和 Current KF 的 ORB 描述子進行特徵匹配。由於存在 keypoints 歸屬於相同的 feature,因此根據 keypoints 匹配可能出現重複的 feature 匹配。因此這裏會從 keypoints 之間的匹配再上升至 feature 之間的匹配,從而去除重複匹配。同時,根據匹配的距離,對匹配對進行篩選,從中選出距離小的有效的匹配對。若是有效匹配對的數量達到必定閾值,則能夠送入下一步。
計算當前幀正確位姿:根據 Candidate KF 的 feature 對應的 MapPoints 與 Current KF 的 feature 之間的匹配,首先進行 PnP 求解,這裏使用了 OpenCV 的 solvePnPRansac()。以後,會再進行一次 g2o 優化,一樣,只優化 Current KF 位姿,MapPoints 僅做爲約束參與優化。若是優化的 inlier 數目超過必定閾值,則最終正式將 Candidate KF 確認爲 Loop KF,並送入接下來的迴環校訂模塊。
迴環校訂:迴環矯正分兩個部分。首先是迴環融合,有了 Current KF 的正確位姿,就能夠對其位姿進行調整。同時,active map 中的 active KFs 會根據它們以前與 Current KF 的相對位姿,同步進行調整(固定相對位姿),同理,active MapPoints 也會根據它們與 active KF 的相對位置,進行相應的調整(固定相對位置)。active map 調整完畢後,會進行一次位姿圖優化,來對以前 KFs 的位姿進行全局調整。位姿圖優化的邊,一種是前端跟蹤時,KF 與相鄰 KF 之間的相對位姿,另外一種就是迴環邊。對 KF 的位姿進行優化後,相應的會將全部的 MapPoints 根據與觀測 KF 之間的相對位置進行位置校訂。
做爲一個 SLAM 的初學者的初級工做,這個項目中可能會存在不少問題或錯誤。若是你們發現了任何問題,歡迎來 issue 一下。很是感謝你們的指正和建議!