【ICCV2019】EPIC-Fusion: Audio-Visual Temporal Binding for Egocentric Action Recognition

時間 2021-01-12

原文原文鏈接

論文下載鏈接： EPIC-Fusion: Audio-Visual Temporal Binding for Egocentric Action Recognition 主要思想使用 Audio-Vision-Flow 3種模態數據作爲輸入的3種數據在時序上不同步，但時差在一定範圍內在網絡中段進行數據融合，即mid-fusion 簡介文章使用EPIC-KITCHEN數據集，包括3種模態數據

>>阅读原文<<