【論文閱讀筆記】Learning Spatiotemporal Features with 3D Convolutional Networks

論文主要貢獻: 1.驗證了3D卷積神經網絡能夠同時捕捉外觀和運動信息,是優秀的特徵提取器。 2.在特定的構架內,3X3X3的卷積核在所有層中都表現出最好的效果。 3.3D卷積神經網絡提取出的特徵結合線性模型分類器所得到的結果在6個數據集(4個識別任務)中都有突出的性能。 好的視頻特徵描述應該包含如下特徵: a)具有通用性,對任意類型的視頻都能夠有好的描述效果。 b)特徵足夠緊湊,緊湊的特徵有利於存
相關文章
相關標籤/搜索