[paper]The Limitations of Deep Learning in Adversarial Settings(JSMA)

與之前的基於提高原始類別標記的損失函數或者降低目標類別標籤概率的損失函數的方式不同,這篇文章提出利用輸入特徵到輸出值之間的對抗顯著性,達到只需修改少量的輸入值即可誤分類的目的。 換句話說,之前的對抗樣本的擾動方向都是損失函數的梯度方向(無論是原始類別標記的損失函數還是目標類別標記的損失函數),該論文生成的對抗樣本的擾動方向是目標類別標記的預測值的梯度方向,作者將這個梯度稱爲前向梯度(forward
相關文章
相關標籤/搜索