【深度學習NLP論文筆記】《Adversarial Example For Natural Language Classification Problems》

一、介紹 圖一:三個在文本分類任務中使用對抗樣本的例子。分別是垃圾郵件分類、情感分析、虛假新聞檢測。全是依靠同義詞替換實現的。  二、背景 分類問題的目標是從輸入和標籤中學習一種映射。其中標籤可能來自K個類,如。 分類器f可能是個深度神經網絡或者線性模型,它會爲輸入x在每個類中的可能性做出評分,並將評分最高的那個類作爲輸入的標籤。 在圖片分類器中,對正常輸入x做擾動後得到x',將其送入分類器,得到
相關文章
相關標籤/搜索