樣本生而不等——聊聊那些對訓練數據加權的方法

現有大部分機器學習或者深度學習的研究工作大多着眼於模型或應用,而忽略對數據本身的研究。今天給大家介紹的幾個文章就關注於在機器學習中如何通過對訓練集的選擇和加權取得更好的測試性能。 在開始之前,先和大家簡單回顧一下我個人覺得相關的幾方面工作。其實遠在深度學習時代之前,根據loss對樣本加權的工作就已經有很多。神奇的是,其實在一條線上有着截然相反的想法的研究:第一類工作的想法是如果一個樣本訓練得不夠好
相關文章
相關標籤/搜索