【論文理解】Clothing Retrieval with Visual Attention Model

本博記錄爲滷煮理解,如有疏漏,請指正。轉載請註明出處。 滷煮:非文藝小燕兒 這是上海交大在2017年10月份投放在arXiv上的一篇文章,比較精簡,只有4頁。 這篇文章主要有兩點: (1)使用了Visual Attention Model(VAM),自動學習出在圖像中的關鍵內容,減少背景的干擾。然後與通常網絡提取出的特徵圖進行融合; (2)特徵融合時,提出一種Impdrop的手段,類似將eleme
相關文章
相關標籤/搜索