深度學習圖像問題集錦

1,訓練集中包含樣本不均衡的多類數據,對於數量多的一類進行下采樣,會導致數據分佈和測試的真實情況不同,會對結果有什麼影響? 答:首先,在構建訓練集和測試集的時候,訓練集和測試集的數據分佈都應該與樣本的真實分佈情況一致,纔能有效訓練並對模型進行測試。所以,當數據不均衡的時候,更要注意數據採樣的重要性。針對醫療數據,假設分爲正常和異常兩類,一般來說,正常樣本佔絕大多數,所以需要對正常樣本進行」下采樣「
相關文章
相關標籤/搜索