深度學習_數據預處理_圖像數據均衡與圖像數據增廣(data augmentation)

首先我們考慮一個二分類問題,比如區分一張圖片裏的是一隻貓還是一隻狗。若數據蒐集的時候只找到了1000張貓的圖片和40000張狗的圖片作爲訓練集。如果直接把這41000張圖片放在一起,然後用mini-batch的方法進行訓練,就會出現數據不均衡的問題。 比如每次迭代的樣本數量爲100個,那麼平均下來每次樣本中貓的數量通常只有1、2個。這樣的結果是計算損失函數時,狗的圖片比重太大,所以相當於是針對狗的
相關文章
相關標籤/搜索