Semantic Visual Localization-論文閱讀筆記

時間 2021-01-04

原文原文鏈接

本文提出了一個基於3D幾何和語義信息進行視覺定位的新方法：具體實現方法：（1）採用RGB-D相機作爲系統輸入，分別對輸入圖像進行像素級的語義分割，並根據深度信息投影到3D空間中，融合得到體素級的3D語義地圖。（2）根據語義類別對體素進行聚類，得到一個個subvolume個體。（3）採用變分編碼-解碼結構對subvolume進行處理，幻想出subvolume中被遮擋的部分（4）採用變分編碼

>>阅读原文<<