[翻譯]End-to-End Learning of Motion Representation for Video Understanding

摘要 儘管端到端學習的表示最近取得了成功,但手工製作的光流特徵仍然被廣泛應用於視頻分析任務中。爲了填補這一空白,我們提出了TVNet,一個新穎的端到端可訓練神經網絡,從數據中學習光流的特徵。TVNet包含了一個特定的光流解算器,即TV-L1方法,並通過將其優化迭代展開爲神經層來初始化。因此,TVNet可以直接使用,無需任何額外的學習。此外,它可以與其他特定於任務的網絡自然地連接起來,以形成端到端結
相關文章
相關標籤/搜索