論文解析:Motion Guided Spatial Attention for Video Captioning

簡介     這篇論文是復旦大學姜育剛教授團隊發表在2019 AAAI上的一篇論文,這篇論文的主要思想是通過光流圖「引導」空間上的注意力,從而實現視頻字幕生成的任務。我個人認爲這篇論文的思想較爲新穎,合理,因此詳細的閱讀了這篇文章並再此做一個記錄。 1.論文思想     這篇論文中提到一個人類視覺注意力的一個「習慣」:人類的注意力更容易被視頻中明顯變化的區域所吸引。基於這個觀點,這篇文章提出一種非
相關文章
相關標籤/搜索