[數學理論]不同分佈訓練集、驗證集、測試集處理

當訓練集、驗證集(開發集)、測試集來源不同,即分佈不同時。需要對其進行處理。 如上圖所示:測試集數據來源於網上清晰圖像,而驗證集、測試集數據來源於業餘人士手機拍照照片。 假設網上下載的照片數據集大小爲200000,而手機拍攝的照片數據集大小爲10000。 有兩種處理方式: 一種將網上數據和手機數據混合,然後將數據隨機分配給訓練集、驗證集和測試集。這種方式最後應用效果不好,如上圖的1圖。 另外一種將
相關文章
相關標籤/搜索