論文筆記 —— StereoNet: Guided Hierarchical Refinement for Real-Time Edge-Aware Depth Prediction

上圖所示爲網絡架構,藍色方框之前的部分是粗粒度的深度估計,這部分首先通過 Encoder 的結構進行圖像特徵提取,然後將左右兩個圖片的特徵得到相應的 Cost Volume, 之後利用三維卷積操作得到 1/8 分辨率的深度圖。 粗粒度的深度估計 提取特徵:左右圖共享權值的暹羅網絡(Siamese Network)分別提取左右圖的特徵,使用 K 個 5*5 的卷積層進行下采樣操作(K 通常取 3 或
相關文章
相關標籤/搜索