爲了加強模型的泛化的性能,通常的手段有數據加強和正則化方法(如dropout,BN),而用於數據加強的通常方法有:隨機裁剪、隨機水平翻轉、平移、旋轉、增長噪音和生成網絡方法等(前兩個方法用的最多,也最有效),做者從CNNs輸入的數據預處理出發,極端的狀況下,若是訓練模型的數據集不多有遮擋的樣本(儘管放大再隨機裁剪必定程度對應對遮擋的情形上有幫助),那麼最終訓練獲得的模型也不能很好處理遮擋情景,爲了使訓練的模型更好的應對做爲影響模型泛化能力的重要而關鍵的因素–遮擋,做者提出了很簡單且實用的無參數數據加強方法—Random Erasing(也能夠被視爲add noise的一種)git
Random Erasing Data Augmentation(REA)是一種隨機擦除的數據增廣方法。簡單而言就是在圖像中隨機選擇一個區域,打上噪聲mask。這個mask能夠是黑塊、灰塊也能夠是隨機正太噪聲。。該方法被證實在多個CNN架構和不一樣領域中能夠提高模型的性能和應對遮擋的魯棒性,而且與隨機裁剪、隨機水平翻轉(還有正則化方法)具備必定的互補性,綜合應用他們,能夠取得更好的模型表現,尤爲是對噪聲和遮擋具備更好的魯棒性。github
(1) 圖片I寬度$W$,高$H$,面積$S$. 擦除區域面積佔比$S_e \in (S_l, S_h)$, 擦除區域長寬比 $r_l \in (r_1, r_2)$ ; (2) 隨機取點($x_e$, $y_e$), 隨機生成擦除區域面積佔比$S_e$, 擦除區域長寬比 $r_l$, 進而計算出mask的寬度$W_e$, 高度$H_e$ ; (3) 判斷mask是否超出圖片邊界, 若是越界返回第二步; (4) 給像素賦隨機值或者均值 (5) 返回新圖片網絡
引用:架構