CVPR2018 | R(2+1)D結構:視頻動作識別中的時空卷積深度探究

本文 是C3D作者Du Tran+IDT作者Heng Wang發表在CVPR2018的新作。來自Facebook Resaerch &Dartmouth Colledge。文章主要對是動作識別中的各種卷積塊進行了深度探究,然後提出了用於視頻動作識別的新型網絡結構:R(2_1)D。 閱讀這篇文章之前,可以看一下對比文章《Learning Spatio-Temporal Representation
相關文章
相關標籤/搜索