【ICCV2019】EPIC-Fusion: Audio-Visual Temporal Binding for Egocentric Action Recognition

論文下載鏈接: EPIC-Fusion: Audio-Visual Temporal Binding for Egocentric Action Recognition 主要思想 使用 Audio-Vision-Flow 3種模態數據 作爲輸入的3種數據在時序上不同步,但時差在一定範圍內 在網絡中段進行數據融合,即mid-fusion 簡介 文章使用EPIC-KITCHEN數據集,包括3種模態數據
相關文章
相關標籤/搜索