SLAM會被深度學習方法取代嗎?

日益感受到本身對深度學習的理解比較膚淺,這段且當作是之前的認識。前端

上上週去圍觀了泡泡機器人和AR醬聯合舉辦的論壇。在圓桌階段,章國峯老師提了一個問題:SLAM會被深度學習方法取代嗎?這是一個頗有趣的話題。參會的各位大咖基本認爲SLAM的某些模塊有可能會被深度學習的方法取代,但SLAM自己不會被取代。視+的CEO則認爲SLAM總體上會被深度學習取代。算法

個人觀點更傾向於前者。略有不一樣之處是,我認爲整個前端(或者說是VO)有可能會被深度學習方法取代,然後端則不會。後端

前端的理由有兩點:網絡

  • 前端是一個適合深度學習處理的問題。其輸入通常是連續圖像(或者其它傳感器數據),輸出是一個六自由度信息。前端有標準的數學模型,而且不算複雜,能夠用神經網絡來表述。
  • 深度學習方法有可能可以解決目前算法的侷限性。無論是特徵點法仍是直接法,前端仍處於low level feature的階段,而low level feature不能知足實際應用中對魯棒性、場景可擴展性的需求。而深度學習方法的優點正是研究人員沒必要再費心於low level design。目前也已經出現用深度學習作stereo feature matching的工做,也有用神經網絡作計算視覺幾何的工做,未來也許能夠實現端到端的輸入輸出。

目前我還有兩個沒想清楚的問題機器學習

  • 現有VO算法中的Consistency問題,不知道深度學習方法可否隱式地解決。
  • 多模態的數據融合是否是能夠比如今作的更好(和上面一條也有必定關係)。

至於後端,目前基於圖的表示已經能夠準確地表述和高效地求解BA問題。在SLAM實時性要求比較高的狀況下,深度學習未必能作得更好(畢竟它也是用迭代算法求解的)。而對於離線數據,SFM已經能夠作得很好了。機器學習方法若是能從新表述data association問題,高效求解並取得更好的結果,纔會有可能取代目前的算法。學習

相關文章
相關標籤/搜索