Predicting Depth, Surface Normals and Semantic Labels with a Common Multi-Scale... 論文筆記

1. 論文介紹 本文作者設計了一種通用的多尺度網絡,僅需要通過少量的修改就能適用於三個不同的計算機視覺任務:深度估計,表面法向量估計,語義分割。給定輸入圖片,網絡能夠直接回歸出輸出圖,如深度圖、法向量圖、分類圖。網絡結構在之前工作上加以改進,堆疊了 3 層卷積神經網絡,從低分辨率逐漸升到高分辨率,進一步改善了圖像細節。測試中,網絡的輸出是實時的,達到了 30Hz 左右,同時生成的結果在三項任務中都
相關文章
相關標籤/搜索