EDA: Easy Data Augmentation Techniques for Boosting Performance onText Classification Tasks

摘要 咱們介紹了EDA:用於提升文本分類任務性能的簡單數據加強技術。EDA由四個簡單但功能強大的操做組成:同義詞替換、隨機插入、隨機交換和隨機刪除。在五個文本分類任務上,咱們證實了EDA在卷積和循環神經網絡上都提升了性能。EDA對較小的數據集顯示了特別強的響應;平均而言,在5個數據集中,使用EDA進行訓練,而僅使用50%的可用訓練集,在全部可用數據集上實現了與正常訓練相同的準確性。咱們還進行了普遍
相關文章
相關標籤/搜索