論文筆記：Show, Edit and Tell : A Framework for Editing Image Captions

時間 2020-12-23

標籤 PAPER 人工智能简体版

原文原文鏈接

背景：對現有字幕進行編輯更容易些，編輯字幕不需要關注現有信息，使它只需要專注於固定細節（例如重複的單詞）就可以。創新點：本文提出了一種基於現有字幕迭代自適應細化的圖像字幕處理方法。我們的模型由兩個子模塊組成： EditNet：具有自適應複製機制(Copy-LSTM)和選擇性複製存儲器注意機制(SCMA)的語言模塊。一個編輯現有圖像標題的框架，由一個帶有選擇性複製存儲器注意(SCMA)

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。