EDA 文本增強(和我的思考)

EDA: Easy Data Augmentation 文章結構:原理、設置參數、代碼。 一、原理 文章來源:https://arxiv.org/abs/1901.11196 通過對文本中部分詞的改變,達到重寫文本,讓樣本數量增多的目的,並增強對應訓練模型的泛化能力。 具體有四種方式: 1、同義詞替換:在句子中的詞中隨即選擇n個非停用詞。將每個詞換成一個隨即的同義詞。 2、隨機插入:在句子中的詞中
相關文章
相關標籤/搜索