Collaborative Spatiotemporal Feature Learning for Video Action Recognition 閱讀筆記

論文筆記 1 介紹 1.1 引子 在本文中,我們提出了一種新穎的協作時空(CoST)特徵學習操作,它與權重共享約束共同學習時空特徵。 給定3D體積視頻張量,我們通過從不同角度觀看它們,將其展平爲三組2D圖像。 然後將2D卷積應用於每組2D圖像。 圖1示出了來自示例性視頻剪輯的三個視圖的2D快照,其中一個人在體育場高跳。 H-W的視圖是人類熟悉的自然景觀。 通過在時間T上從該視圖逐幀掃描視頻,我們能
相關文章
相關標籤/搜索