視頻動作識別——TLE模型解讀

Deep Temporal Linear Encoding Networks 這是CVPR2017的文章,主要提出了一種時序線性編碼層(Temporal Linear Encoding, TLE)來對視頻分段提取後的特徵圖進行融合編碼,最後得到的效果相對來說已經很不錯了。搜索的時候發現沒有什麼對它解讀的文章,於是就自己看完來大概寫一下。 TLE這篇文章認爲,在一段視頻中,連續幀之間的移動通常很微小
相關文章
相關標籤/搜索