論文筆記:Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

論文發表於CVPR2017,先放上論文鏈接:添加鏈接描述 在圖像領域的大規模ImageNet數據集,對於圖像分類、目標檢測、語義分割等任務,在其上預訓練的模型遷移到相應的數據集時可以獲得非常好的效果,從而在ImageNet上進行預訓練這一手段被廣泛的應用於圖像任務。相應的,在視頻領域上是否存在這樣的大規模視頻數據集?在這樣的數據集上進行預訓練是否可以提高視頻行爲識別(分類)的精度?該篇文章介紹了大
相關文章
相關標籤/搜索