ICCV 2019 論文解讀 | 基於層次解析的Image Captioning

©PaperWeekly 原創 · 作者|蔡文傑 學校|華南理工大學 研究方向|計算機視覺 目前大多數的 image captioning 模型採用的都是 encoder-decoder 的框架。本文在 encoder 的部分加入了層次解析(Hierarchy Parsing, HIP)結構。HIP 把圖片解析成樹狀結構:根節點是整個圖片,中間節點則是通過把圖片分解成一系列 Region-leve
相關文章
相關標籤/搜索