論文閱讀:《Flowing ConvNets for Human Pose Estimation in Videos》ICCV 2015

概述 本文主要用CNN網絡來進行人體姿態估計,加入了temporal 信息以提高精度。本文的四個貢獻: 1. 提出了一個更深的CNN網絡(相比於Alex-Net),不同於之前的迴歸座標,而是迴歸heatmap,這樣可以提高關節點定位的魯棒性,並且更利於在訓練過程中的可視化觀察。 2. 提出一種空間融合層,用來學習隱式空間模型,即用來提取關節點之間的內在聯繫 3. 使用光流信息,用來對準相鄰幀的he
相關文章
相關標籤/搜索