Two-Stream Convolutional Networks for Action Recognition in Videos(summary part)

算法介紹 雙流網絡使用以單幀RGB作爲輸入的CNN來處理空間維度的信息,使用以多幀密度光流場作爲輸入的CNN來處理時間維度的信息,並通過多任務訓練的方法將兩個行爲分類的數據集聯合起來(UCF101與HMDB),去除過擬合進而獲得更好效果。 貢獻 提出two-stream ConvNet來對時空特徵進行建模表示 提出了多幀光流作爲輸入,對性能提升作用很大 源碼 未公開源碼 光流 圖像中物體的運動可以
相關文章
相關標籤/搜索