NLP論文筆記:Easy Data Augmentation Techniques for Boosting Performance on Text Classification Task

代碼:eda EDA 文中提到了4種數據增強技術 用於文本分類任務,並用了2種常用的文本分類的深度學習模型在5個benchmark上跑了一下分類(5個banckmark: SST-2, CR, SUBG, TREC, PR), 在跑模型的時候作者將訓練集分爲3種規模大小 從而比較EDA技術在訓練數據集規模上的影響。 4種數據增強技術: 同義詞替換 隨機插入 隨機交換 隨機刪除 5個banckmar
相關文章
相關標籤/搜索