Semantic Visual Localization-論文閱讀筆記

本文提出了一個基於3D幾何和語義信息進行視覺定位的新方法: 具體實現方法: (1)採用RGB-D相機作爲系統輸入,分別對輸入圖像進行像素級的語義分割,並根據深度信息投影到3D空間中,融合得到體素級的3D語義地圖。 (2)根據語義類別對體素進行聚類,得到一個個subvolume個體。 (3)採用變分編碼-解碼結構對subvolume進行處理,幻想出subvolume中被遮擋的部分 (4)採用變分編碼
相關文章
相關標籤/搜索