Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

時間 2021-01-05

原文原文鏈接

本文是deepmind出品，目的，就一個，放出個關於視頻方面的訓練集kinetics，一個四百個類，每個類有至少四百個clips，每個clips十秒鐘，屬於從youtube上剪切的視頻，然後對比了幾種現在存在的用於行爲識別的幾種框架，具體如下圖：其中，a，b，c，d是現有的做法，作者提出了e，唉，這種框架，感覺有點和前面沒啥區別。然後，神奇的事情出現了：這個數據集上訓練的模型，通過遷移學習到U

>>阅读原文<<