論文閱讀 Deep TEN: Texture Encoding Network

1、Introduction 說實話和作者的context encoding那篇有點重了的感覺 作者將字典學習和編碼融合到一個模型裏面了 inherent的視覺字典是從損失中直接學習出來的 整個的表示是無序的,對於material和texture識別是特別有效的 最後的encoder層是傳統的residual encoder(VLAD,FISHER)的一個全新的泛化,能夠丟棄domain-spec
相關文章
相關標籤/搜索