PGD:Towards Deep Learning Models Resistant to Adversarial Attacks

一.摘要 1.出發點:(1)深度網絡對對抗攻擊(adversarial attack)即對對抗樣本的天生缺陷。 (2)當輸入信息與自然樣本差別並不大是卻被網絡錯誤的分類,如下圖。 2.作者提出方法和論證如下: (1)從魯棒優化的角度研究了神經網絡的抗差魯棒性。這與很多最近的相關工作具有廣泛的一致性 eg:防禦蒸餾,特徵壓縮。 (2)根據方法的原理性使得該方法在普遍範圍內是通用和有效的,即使用最強的
相關文章
相關標籤/搜索