譯:Two-Stream Convolutional Networks for Action Recognition in Videos

摘要:咱們研究了用於訓練視頻中行爲識別的深度卷積網絡架構。這個挑戰是捕捉靜態幀中的外觀和連續幀間的運動的互補信息。咱們也旨在推廣這個在數據驅動的學習框架中表現得最好的手工特徵。web 本文一共作出了3個貢獻:算法 首先,本文提出了一個two-stream卷積網絡架構,這個架構由時間和空間網絡構成。 而後,咱們驗證了,儘管是有限的訓練數據集,在多幀密集光流上訓練的卷積網絡仍然可以表現出很好的性能。
相關文章
相關標籤/搜索