關於樣本均衡的一點點思考

背景: 在分類場景中常常會遇到,某些類別數據特別多,某類或者幾類數據特別少。做爲極限測試,假如正樣本10000個,負樣本只有1個。進行模型參數優化。其實至關於一直在優化正樣本,使得正樣本過學習,負樣本幾乎沒有優化模型參數。針對負樣本的1個,很大機率是有問題。爲了重述上面的問題。假如如今一個三歲的孩子須要識別哪些是玉米,哪些是小麥。如今有10000個是小麥,只有一個是玉米。那麼三歲的孩子會一直處在學
相關文章
相關標籤/搜索