Videos as Space-Time Region Graphs閱讀筆記

1.解決問題:基於I3D模型,使用圖模型,以構造視頻中物體間的關係,提升識別精度。 本文是將video看做是 a graph of objects,然後再該graph上進行行爲識別的推理。 2.實驗效果:在somethingV1數據集上,test:45% 相對於I3D 提高1.7% ,相對於TRN網絡提高12% 3.圖卷積層的定義:Z=GXW 其中x是圖卷積輸入節點是特徵(Nxd),G各個節點之間
相關文章
相關標籤/搜索