論文解析：Motion Guided Spatial Attention for Video Captioning

時間 2020-12-29

原文原文鏈接

簡介這篇論文是復旦大學姜育剛教授團隊發表在2019 AAAI上的一篇論文，這篇論文的主要思想是通過光流圖「引導」空間上的注意力，從而實現視頻字幕生成的任務。我個人認爲這篇論文的思想較爲新穎，合理，因此詳細的閱讀了這篇文章並再此做一個記錄。 1.論文思想這篇論文中提到一個人類視覺注意力的一個「習慣」：人類的注意力更容易被視頻中明顯變化的區域所吸引。基於這個觀點，這篇文章提出一種非