[paper]Universal adversarial perturbations

本文提出了計算自然圖像中普遍擾動的算法,在神經網絡上具有很好的泛化性,並且揭示了模型在高維空間中決策邊界的幾何聯繫。並且說明了在輸入空間中存在單個方向的潛在安全漏洞,攻擊者可能會利用這些漏洞造成模型對大多數自然圖像分類錯誤。 universal 算法: μ \mu μ是圖像分佈 v v v是universal擾動 k ^ \hat{k} k^是模型 universal擾動 v v v需要滿足兩個條
相關文章
相關標籤/搜索