Video Understanding(視頻理解)

CV領域圖像已經登天很難短時間玩不出大花樣大結構了(希望能早日打臉),大家開始打往視頻上面靠的主意。由於早期限制於數據集和計算設備,多是從圖像的2D模型直接轉換成3D版本,如SIFT 3D,3D HOG,或者Dense Trajectory這種統治了很久的模型等,等到深度學習開始步入新的週期,數據集也開始擴增出現UCF101,ActivityNet,Charades,YouTube8M,Kinet
相關文章
相關標籤/搜索