X3D: Expanding Architectures for Efficient Video Recognition個人論文筆記

https://zhuanlan.zhihu.com/p/129279351 這篇X3D的解讀寫的比我早,寫的挺好的,但有些細節沒寫上,所以由於強迫症寫了這篇個人筆記 X3D爲一系列的高效視頻分類網絡(從2D圖像分類網絡不斷的從各個方面(multiple network axes)進行擴張如幀頻網絡深度等等,每次只從一個方面進行擴張);漸進的前向擴張後是一個後向壓縮從而達到一個固定複雜度的網絡;X
相關文章
相關標籤/搜索