論文筆記:ARTNet、Non-local Neural Networks

《Appearance-and-Relation Networks for Video Classification》 鏈接: https://arxiv.org/abs/1711.09125. 這篇文章中,作者認爲在分類視頻工作時最主要要抓住兩點,1是每一幀的靜態外觀,2、是跨多幀之間的時序關係。 幀的靜態外觀很好提取,處理視頻最重要的難點就在於如何表示多幀之間的時序關係。主流的做法有兩種,1是
相關文章
相關標籤/搜索