視頻理解論文雜讀(門外漢級)

從圖片到視頻肯定是科研發展的方向,可惜需要的資源太多,像我這種只有一個GPU的根本做不了,不過學習學習總是好的。 未完成,主要自己看,主要是動作識別方向   [CVPR-2018] Non-local Neural Networks [paper][code]  其實我對該論文的做法是抱保留態度的,雖然他的出發點我是十分贊同的。該工作主要是想利用空間和時間上全局的信息來輔助視頻或圖片上的理解任務,
相關文章
相關標籤/搜索