TEA: Temporal Excitation and Aggregation for Action Recognition閱讀筆記

一、簡介 考慮時間建模在視頻中行爲識別的重要性,包括運動激發模塊(ME)和一個多時間聚合模型(MTA),將他們嵌入一個標準ResNet塊中,重新生成一個時間激發和聚合塊,ME和MTA分別作用在短程運動和長程聚集上。ME模塊利用從時空特徵中計算的特徵等級時間差異去激活特徵的動作敏感通道。MTA模塊將局部卷積變形爲一組子卷積,形成一個層次化剩餘結構。 創新點: 使用ME模塊來代替傳統的提取手工光流後輸
相關文章
相關標籤/搜索