論文筆記:Skeleton Key_Image Captioning by Skeleton-attribute Decomposition

Skeleton Key: Image Captioning by Skeleton-Attribute Decomposition 這篇文章的作者提出,人類認識圖的過程,應該是先定位圖片的位置和他們的關係,然後纔是詳盡的說明物體的屬性。這篇文章基於此設計了一種coarse-to-fine的方法,首先生成skeleton sentence,然後生成相應的屬性短語,最後將這兩部分合成完整的capti
相關文章
相關標籤/搜索