論文筆記:Say As You Wish: Fine-grained Control of Image Caption Generation with Abstract Scene Graphs

背景: 大多數圖像字幕模型不能主動根據用戶的意圖來生成不同的描述。 創新點: 我們提出了抽象場景圖(ASG)結構來表示細粒度級別的用戶意圖,並控制生成的描述對象和細節。 在本工作中,我們提出了一種更細粒度的控制信號-抽象場景圖(ASG),以表示可控圖像標題生成的不同意圖。如圖1所示,ASG爲一個有向圖,由三種抽象節點組成,分別是對象、屬性和關係,而每個節點不需要具體的語義標籤。因此,這種圖形結構很
相關文章
相關標籤/搜索