數據類別不平衡/長尾分佈?不妨利用半監督或自監督學習

於類別不均衡的學習問題,利用 1.半監督學習 --- 也即利用更多的無標籤數據; 2.自監督學習 --- 不利用任何其他數據,僅通過在現有的不平衡數據上先做一步不帶標籤信息的自監督預訓練(self-supervised pre-training)   都可以大大提升模型的表現,並且對於不同的平衡/不平衡的訓練方法,從最基本的交叉熵損失,到進階的類平衡損失[1][2],重採樣[3],重加權[4][5
相關文章
相關標籤/搜索