Cooperative Holistic Scene Understanding: Unifying 3D Object, Layout, and Camera Pose Estimation2019

加利福尼亞大學洛杉磯分校, RGB,整體場景理解(目標檢測、佈局檢測、相機位姿預測) 總結: 以單個RGB圖像爲輸入,提出了一種實時(2.5fps)恢復三維室內場景的端到端模型,包括三維房間佈局、相機位姿和目標邊界框。引入三維目標框的參數化和二維投影loss,增強了二維與三維的一致性,設計了可微的協同loss,有助於兩個主要模塊的協同高效訓練。 以往的三維重建和整體場景理解通過增加一些2D-3D約
相關文章
相關標籤/搜索