Videos as Space-Time Region Graphs閱讀筆記

時間 2021-01-17

原文原文鏈接

1.解決問題：基於I3D模型，使用圖模型，以構造視頻中物體間的關係，提升識別精度。本文是將video看做是 a graph of objects,然後再該graph上進行行爲識別的推理。 2.實驗效果：在somethingV1數據集上，test：45% 相對於I3D 提高1.7% ，相對於TRN網絡提高12% 3.圖卷積層的定義：Z=GXW 其中x是圖卷積輸入節點是特徵（Nxd），G各個節點之間

>>阅读原文<<