NLP數據加強方法總結:EDA、BT、MixMatch、UDA

1. 數據加強的背景和應用場景 隨着AI技術的逐步發展,更好的神經網絡模型對數據規模的要求也逐步提高。而在分類任務中,若不一樣類別數據量相差很大,模型則會出現過擬合現象,嚴重影響預測的正確性。python 從廣義上來說,有監督模型的效果相對半監督或無監督學習都是領先的。可是有監督模型須要獲取大量的標註數據,當數據需求達到十萬、百萬甚至更多時,人工標註數據昂貴的代價已經讓不少人望而卻步。nginx
相關文章
相關標籤/搜索