【PaperNotes】視頻分類【一】

Appearance-and-Relation Networks for Video Classification 簡介 提出ARTNet,學習端到端的視頻表徵 ARTNets是由多個SMART blocks堆疊而來的,SMART可用於同時從RGB輸入中建模出appearance與relation SMART將spatiotemporal學習分爲兩部分:用於空間建模的appearance分支與用於
相關文章
相關標籤/搜索