文本增強技術

時間 2021-07-13

標籤技術問題 # 深度學習深度學習简体版

原文原文鏈接

參考資料熵簡科技-李漁博士的報告《文本增強技術的研究進展及應用實踐》背景本質上是增加少類樣本（數量少或者類型單一）的數量具體場景包括少樣本場景（如文本標註耗時耗力很難獲取很多）分類任務中樣本不均衡（note：常見方法-欠採樣 ( undersampling ) 和過採樣 ( oversampling ) 會對模型帶來怎樣的影響？) 半監督訓練（19年google半監督學習算法 UDA 可

>>阅读原文<<