論文筆記:Show, Edit and Tell : A Framework for Editing Image Captions

背 景: 對現有字幕進行編輯更容易些,編輯字幕不需要關注現有信息,使它只需要專注於固定細節(例 如重複的單詞)就可以。 創新點: 本文提出了一種基於現有字幕迭代自適應細化的圖像字幕處理方法。 我們的模型由兩個子模塊組成: EditNet:具有自適應複製機制(Copy-LSTM)和選擇性複製存儲器注意機制(SCMA)的語言模塊。一個編輯 現有圖像標題的框架,由一個帶有選擇性複製存儲器注意(SCMA)
相關文章
相關標籤/搜索