see the forest for the trees:spitial and temporal recurrent neural networks for video-based re-id

這是一篇來自2017年的中科院自動化所的論文,也是導師讓讀的3篇神經網絡與多任務學習的3篇論文之一。讀的不是很懂,把主要方法記錄一下。 這篇論文采用三元組的輸入形式,以序列3元組的形式去計算損失函數。在使用CNN去提取特徵之後,分別通過時序RNN去學習特徵,和圖像序列組合後通過空間RNN來進行度量學習。 下圖是本文的基本結構和框架: 從總體框架來看,這篇和之前看的論文的孿生網絡+RNN提取特徵的方
相關文章
相關標籤/搜索