Revisiting Temporal Modeling for Video-based Person ReID 時序特徵深度網絡建模

Revisiting Temporal Modeling for Video-based Person ReID 圖1:基於圖像級特徵提取器(通常是2dcnn)的三種時態建模架構(A: temporal pooling,B: RNN, C: temporal attention)。 對於RNN,使用最終隱藏狀態或單元輸出的平均值作爲剪輯級表示; 對於時間注意,給出了兩種類型的注意產生網絡:「spa
相關文章
相關標籤/搜索