譯：Two-Stream Convolutional Networks for Action Recognition in Videos.md

時間 2021-01-02

原文原文鏈接

摘要：我們研究了用於訓練視頻中行爲識別的深度卷積網絡架構。這個挑戰是捕捉靜態幀中的外觀和連續幀間的運動的互補信息。我們也旨在推廣這個在數據驅動的學習框架中表現得最好的手工特徵。本文一共做出了3個貢獻：首先，本文提出了一個two-stream卷積網絡架構，這個架構由時間和空間網絡構成。然後，我們驗證了，儘管是有限的訓練數據集，在多幀密集光流上訓練的卷積網絡仍然能夠表現出很好的性能。最後，我們