ICCV2019 Multi-Level Bottom-Top and Top-Bottom Feature Fusion for Crowd Countin論文筆記

概述 人羣計數的目標是生成對應圖片的人羣密度圖,在過去的方法中,採用的多尺度特徵融合的方式常常是將低級的特徵連接到網絡的末尾。但本文以爲這樣的方式可能會影響低層網絡的性能。 我們知道,網絡的高層常常代表了更豐富的語義特徵,但由於多次的池化等做做後失去了空間位置的特徵。而網絡的低層則更多對應着細節和空間位置等信息。因此一種直觀的想法就是將底層的特徵和高層的特徵進行融合,作爲最終特徵的輸出。過去的研究
相關文章
相關標籤/搜索