Spatiotemporal Residual Networks for Video Action Recognition

時間 2020-12-23

原文原文鏈接

這篇文章出自2016 NIPS，作者是格林茨大學的Feichtenhofer。背景：幾乎現在行爲識別領域，比較work的工作都是基於二流網絡。其中appearance和motion分別由兩個不同的網絡學習，並將兩個網絡的結果做融合後產生識別。本文創新部分： a、將二維空間ResNet網絡部分擴展到時間域。即原來的二維空間網絡W*H*C 映射到W*H*T*C，具體初始化方法如下：這樣的好處

>>阅读原文<<