[翻譯]End-to-End Learning of Motion Representation for Video Understanding

時間 2021-01-04

原文原文鏈接

摘要儘管端到端學習的表示最近取得了成功，但手工製作的光流特徵仍然被廣泛應用於視頻分析任務中。爲了填補這一空白，我們提出了TVNet，一個新穎的端到端可訓練神經網絡，從數據中學習光流的特徵。TVNet包含了一個特定的光流解算器，即TV-L1方法，並通過將其優化迭代展開爲神經層來初始化。因此，TVNet可以直接使用，無需任何額外的學習。此外，它可以與其他特定於任務的網絡自然地連接起來，以形成端到端結