NLP論文筆記:Easy Data Augmentation Techniques for Boosting Performance on Text Classification Task

時間 2020-12-30

原文原文鏈接

代碼：eda EDA 文中提到了4種數據增強技術用於文本分類任務，並用了2種常用的文本分類的深度學習模型在5個benchmark上跑了一下分類(5個banckmark: SST-2, CR, SUBG, TREC, PR)，在跑模型的時候作者將訓練集分爲3種規模大小從而比較EDA技術在訓練數據集規模上的影響。 4種數據增強技術：同義詞替換隨機插入隨機交換隨機刪除 5個banckmar

>>阅读原文<<