[paper]ADVERSARIAL MACHINE LEARNING AT SCALE

本文的貢獻包括: (1)如何將對抗訓練擴展到大型模型和數據集; (2)對抗訓練賦予單步攻擊算法魯棒性的原理; (3)發現多步攻擊算法的可移植性相比單步攻擊算法要差一些,因此單步攻擊算法最適合於發動黑盒攻擊。 (4)對於「標籤泄漏」效應的解決方法。 「標籤泄漏」效應即經過對抗訓練的模型在對抗樣本上的性能要比在原始樣本上更好,因爲對抗樣本生成過程中使用真實標籤,並且模型可以學習對抗樣本生成過程中的規律
相關文章
相關標籤/搜索