Tencent ML-Images: A Large-Scale Multi-Label Image Database for Visual Representation Learning

摘要: 現有的視覺表達學習任務中,深度神經網絡通常由單個標籤的圖像訓練而來,例如ImageNet。然而單個標籤很難描述樣本中所有的重要內容,有些有用的視覺信息在訓練時可能會浪費掉了。本文中,我們期望利用多標籤的圖像訓練CNNs,從而增強訓練出來的CNN模型的表達質量。爲了達到目的,我們建立一個包含18M圖像,11K類別的大規模多標籤樣本集,稱爲Tencent ML-Images。我們高效的利用大規
相關文章
相關標籤/搜索