文本增強技術

參考資料熵簡科技-李漁博士的報告《文本增強技術的研究進展及應用實踐》 背景 本質上是增加少類樣本(數量少或者類型單一)的數量 具體場景包括 少樣本場景(如文本標註耗時耗力很難獲取很多) 分類任務中樣本不均衡(note:常見方法-欠採樣 ( undersampling ) 和過採樣 ( oversampling ) 會對模型帶來怎樣的影響?) 半監督訓練(19年google半監督學習算法 UDA 可
相關文章
相關標籤/搜索