Spatiotemporal Residual Networks for Video Action Recognition

這篇文章出自2016 NIPS, 作者是格林茨大學的Feichtenhofer。 背景:幾乎現在行爲識別領域,比較work的工作都是基於二流網絡。其中appearance和motion分別由兩個不同的網絡學習,並將兩個網絡的結果做融合後產生識別。 本文創新部分: a、將二維空間ResNet網絡部分擴展到時間域。即原來的二維空間網絡W*H*C 映射到W*H*T*C, 具體初始化方法如下: 這樣的好處
相關文章
相關標籤/搜索