[paper]UPSET and ANGRI:Breaking High Performance Image Classiﬁers

時間 2021-07-11

原文原文鏈接

提出了兩種攻擊算法，第一種是針對輸出類別生成通用擾動（定向攻擊），第二種針對不同圖像生成特定擾動（定向攻擊）。 UPSET:Universal Perturbations for Steering to Exact Targets UPSET網絡爲針對原始圖像生成具有通用擾動的對抗樣本，且可以使模型誤分類爲指定的目標類別。 x x x：原始圖像 t t t ：目標類別 x ^ \hat{x} x^

>>阅读原文<<