論文記錄-帶有注意機制的圖像字幕生成系統

本週總結記錄的論文題目爲「Visual Attention Based on Long-Short Term Memory Model for Image Caption Generation」,主要介紹經過使用融合了注意力機制的LSTM(是RNN的特殊形式,二者都重視序列並有反饋,LSTM彌補了RNN在梯度問題上的不足)模型來改善描述圖像的語句的準確度。注意力機制是一種模仿人類天然的視覺注意力機
相關文章
相關標籤/搜索