【論文閱讀筆記】Learning Spatiotemporal Features with 3D Convolutional Networks

時間 2020-12-30

原文原文鏈接

論文主要貢獻： 1.驗證了3D卷積神經網絡能夠同時捕捉外觀和運動信息，是優秀的特徵提取器。 2.在特定的構架內，3X3X3的卷積核在所有層中都表現出最好的效果。 3.3D卷積神經網絡提取出的特徵結合線性模型分類器所得到的結果在6個數據集（4個識別任務）中都有突出的性能。好的視頻特徵描述應該包含如下特徵： a）具有通用性，對任意類型的視頻都能夠有好的描述效果。 b）特徵足夠緊湊，緊湊的特徵有利於存