數據清洗---測試集和訓練集分佈不一致的狀況

在競賽中,能夠會出現提供的數據不符合測試集分佈的狀況 根據百度車道線冠軍的經驗: 數據清洗上,最一開始採用了所有數據訓練,發現loss常常出現不規則的跳動,通過排查,發現road 3存在幾乎一半以上圖像過曝的問題,而且road 3大多在強光下拍攝,不符合測試集的分佈,因此很果斷的捨棄了road 3,分數也提高了0.01左右(好神奇。。。)。 這就說明了,在數據來源不一樣的狀況下,極可能出現訓練集與
相關文章
相關標籤/搜索