視頻理解 S3D,I3D-GCN,SlowFastNet, LFB

接着上次的《活體檢測Face anti-spoofing綜述》,再來說講arXiv上新掛的文章:算法   最近看了下幾篇動做識別,視頻理解的文章,在這裏記下小筆記,簡單過一下核心思想,以便後續查閱及拓展使用。網絡 文章主要想探索的問題以下:架構 1.如何改造I3D,使其更輕量且性能更好?框架 2.如何改造I3D,使其理解視頻場景裏的物體交互?ide 3.如何高效融合不一樣幀率,不一樣 tempor
相關文章
相關標籤/搜索