ICCV 2019 論文解讀 | 基於層次解析的Image Captioning

時間 2020-12-30

原文原文鏈接

©PaperWeekly 原創 · 作者｜蔡文傑學校｜華南理工大學研究方向｜計算機視覺目前大多數的 image captioning 模型採用的都是 encoder-decoder 的框架。本文在 encoder 的部分加入了層次解析（Hierarchy Parsing, HIP）結構。HIP 把圖片解析成樹狀結構：根節點是整個圖片，中間節點則是通過把圖片分解成一系列 Region-leve

>>阅读原文<<