ReID簡記-3-3D PersonVLAD: Learning Deep Global Representations for Video-based Person Re-id

創新點 1.基於視頻的行人ReID方法:3D Person VLAD aggregation 2.闡述了時空注意力的優勢和VLAD aggregation 的重要性 總結 網絡結構如圖所示,輸入時確定長度的視頻。 最主要的是接下來的部分。 3D身體校準網絡如下: 此部分包含B個分支,每個分支估計一個注意力圖。通過這個注意力圖,可以平衡3D卷積特徵。B個分支的輸入都是相同的。每個分支檢測一個有分辨性
相關文章
相關標籤/搜索