多模態小組閱讀筆記精選 | 每週一起讀 #7

本期精讀文章 An Empirical Study of Language CNN for Image Captioning 文章來源 https://arxiv.org/abs/1612.07086 推薦理由 本篇論文提出了用 CNN 模型來對單詞序列進行表達,該 CNN 的輸入爲之前時刻的所有單詞,進而可以抓住對生成描述很重要的歷史信息。其中總體架構如下圖所示: 該模型主要由四部分組成,用於圖
相關文章
相關標籤/搜索