Deep High-Resolution Representation Learning for Human Pose Estimation

基本思想: 作者觀察到,現有姿態估計算法中往往網絡會有先降低分辨率再恢復高分辨率的過程,比如下面的幾種典型網絡。 爲便於表達,在下面的a、b、c、d四幅圖中,同一水平線上的特徵圖爲相同分辨率,越向下分辨率越小,在最終的高分辨率特徵圖heatmap中計算姿態估計的關鍵點。 下圖描述了作者的思想: 在上圖中網絡向右側方向,深度不斷加深,網絡向下方向,特徵圖被下采樣分辨率越小,相同深度高分辨率和低分辨率
相關文章
相關標籤/搜索