論文筆記 —— StereoNet: Guided Hierarchical Refinement for Real-Time Edge-Aware Depth Prediction

時間 2021-01-11

原文原文鏈接

上圖所示爲網絡架構，藍色方框之前的部分是粗粒度的深度估計，這部分首先通過 Encoder 的結構進行圖像特徵提取，然後將左右兩個圖片的特徵得到相應的 Cost Volume，之後利用三維卷積操作得到 1/8 分辨率的深度圖。粗粒度的深度估計提取特徵：左右圖共享權值的暹羅網絡（Siamese Network）分別提取左右圖的特徵，使用 K 個 5*5 的卷積層進行下采樣操作（K 通常取 3 或