論文閱讀 Deep Attentional Structured Representation Learning for Visual Recognition

Abstract 深度學習能夠融合一些局部特徵,但是在一定程度上忽略了很多的局部有判別力的特徵,這個時候需要attention來幫忙,對於常見的結構表達BOW,VLAD也有了長足的發展,NetVLAD,和FisherNet,本文最後的優化採用了NetVLAD的優化方法,解耦了dictionary和descriptor之間的關係 所以本文就是NetVLAD+attention Architectur
相關文章
相關標籤/搜索