文本數據增強二(EDA、同義詞替換-新增-交換-刪除-生成同義句)

一.中文文本數據增強       (中文、同義句生成、enhance、augment、text、data、nlp、樣本不均衡、語料不夠、數據不足、擴充增加),相較於圖片,中文文本數據強的效果似乎沒那麼靠譜(效果沒那麼好),也更加困難,但是捏,很多時候,使用中文文本數據增強還是很有必要的,尤其是項目初期語料不夠(估計只能手工構建),或者是樣本嚴重不均衡的情況(比如說分類中一個類有200條數據,另外一
相關文章
相關標籤/搜索