[paper]UPSET and ANGRI:Breaking High Performance Image Classifiers

提出了兩種攻擊算法,第一種是針對輸出類別生成通用擾動(定向攻擊),第二種針對不同圖像生成特定擾動(定向攻擊)。 UPSET:Universal Perturbations for Steering to Exact Targets UPSET網絡爲針對原始圖像生成具有通用擾動的對抗樣本,且可以使模型誤分類爲指定的目標類別。 x x x:原始圖像 t t t :目標類別 x ^ \hat{x} x^
相關文章
相關標籤/搜索