Mind‘s eye: A recurrent visual representation for image caption generation

Mind’s eye: A recurrent visual representation for image caption generation 頭腦:用於圖像標題生成的循環視覺表示 摘要:在本文中,我們探索圖像之間的雙向映射及其基於句子的描述。 對於我們的方法而言,至關重要的是一個遞歸神經網絡,它會在生成或讀取字幕時嘗試動態構建場景的視覺表示。 代表會自動學會記住長期的視覺概念。 我們的模型
相關文章
相關標籤/搜索