《SlowFast Networks for Video Recognition》閱讀筆記

這是愷明大佬實驗室的今年的新作。接下來我就大體按照原文對內容的安排來聊一聊這篇文章吧。 Abstract 他們的模型分爲兩個部分: 一、低幀速率運行的Slow pathway,用來捕獲空間的語義信息; 二、高幀速率運行的Fast pathway,以良好的時間分辨率來捕獲動作信息;關於Fast pathway,作者通過減少通道來使其變得特別輕巧(圖像的細節特徵不依賴這個提取),其主要學習時間維度上的
相關文章
相關標籤/搜索