一份基於Pytorch的視頻分類教程

這是一個在UCF101上使用3D RNN/CNN+RNN 進行視頻分類的教程,基於Pytorch實現。 數據集 UCF101 含有包括13320個視頻與101個動作,視頻有不同的視覺長度,視頻畫面大小也不一樣,最小的視頻只有29幀。爲了減少視頻預處理工作,我們之間使用feichtenhofer預處理結束的數據。 https://github.com/feichtenhofer/twostreamf
相關文章
相關標籤/搜索