Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

本文是deepmind出品,目的,就一個,放出個關於視頻方面的訓練集kinetics,一個四百個類,每個類有至少四百個clips,每個clips十秒鐘,屬於從youtube上剪切的視頻,然後對比了幾種現在存在的用於行爲識別的幾種框架,具體如下圖: 其中,a,b,c,d是現有的做法,作者提出了e,唉,這種框架 ,感覺有點和前面沒啥區別。然後,神奇的事情出現了:這個數據集上訓練的模型,通過遷移學習到U
相關文章
相關標籤/搜索