RNN 在圖像描述生成中扮演的角色?(翻譯)

摘要 在圖像描述生成系統中,遞歸神經網絡(RNN)通常被視爲主要的「生成」組件。這個觀點表明圖像特徵應該被注入到RNN中。這實際上是文學中的主導觀點。或者,RNN可以被視爲僅對先前生成的詞進行編碼。這個觀點表明,RNN只能用來編碼語言特徵,只有最後的表示與後期的圖像特徵「合併」。 本文比較了這兩種體系結構。我們發現,一般來說,後期合併優於注入,這表明RNN更好地被視爲編碼器,而不是發生器。 引言
相關文章
相關標籤/搜索