MIT 與 Facebook 用於動做分類和定位的大規模視頻數據集的標註方法

圖像分類和目標檢測領域近年來取得了重大的平行進展。能夠認爲,這些進展歸功於數據集的質量提升和數量增加,進而逐步成功地應用到了更復雜的學習模型中。在圖像分類中,咱們有從 Caltech101(2004,只有 9146 個樣本)到 ImageNet(2011,包含 120 萬個樣本)這樣的數據集。在目標檢測中,儘管收集邊界框信息所需的額外人類標註成本提升了,但也出現了訓練集規模逐漸擴展的類似趨勢。Pa
相關文章
相關標籤/搜索