加強模型魯棒性！博世提出元對抗訓練方法

介紹一篇對抗學習最新論文 Meta Adversarial Training ，做者來自德國博世公司。node

引言

深度學習模型中一個很致命的弱點就是它容易遭到對抗樣本攻擊。在真實物理世界中，通用對抗樣本能夠低成本的對深度模型進行對抗攻擊，這種對抗攻擊能夠在各類環境中欺騙模型。git

到目前爲止對抗訓練是針對對抗攻擊最有效的防護手段，但問題在於訓練對抗模型是一件成本很高的事情，並且防護通用對抗樣本難度會更大。github

在該論文中做者提出了一種元對抗訓練方式，它將對抗訓練和元學習的結合在一塊兒，不只下降訓練成本，並且大大提升了深度模型對通用對抗樣本的魯棒性。
web

背景介紹

通用對抗擾動於2017年的《Universal adversarial perturbations》中被首次提出。算法

通用對抗擾動與單一圖片的對抗擾動有很大的區別。通用對抗擾動最大的一個特色就是該擾動與輸入圖片無關，它與模型自己和整個數據集相關；微信

而單一圖片的對抗擾動只是針對於它的輸入圖片，對數據集其它的圖片攻擊性幾乎沒有。
網絡

如上圖所示，假若有一個動物數據集和經該數據集上訓練獲得神經網絡分類器，通過對抗攻擊生成了針對於該動物數據集和該模型的通用對抗擾動Universal perturbation。app

將該對抗擾動加在選取出的貓，狗，兔子，猴子，鳥的圖片，並輸入到分類器中，分類器所有分類出錯。
編輯器

模型介紹

假定是維向量數據點和相應標籤上的分佈，爲待優化模型參數，爲損失函數，爲對抗擾動集合，爲對數據點施加擾動的函數，爲隨機擾動向量。svg

對於通用對抗擾動，對抗擾動的集合表示爲:

對於通用Patch 擾動，函數 b表示爲：

(1)

其中，mask爲，對抗擾動的空間爲，隨機變換爲。

根據公式（1），做者從新定義了通用對抗損失爲：

(2)

目的是找到使通用對抗損失最小化的模型參數即，這與標準對抗訓練的思路一致，即內部最大化（生成對抗樣本），外部最小化（利用對抗樣本更新模型參數）。

做者通用對抗擾動的初始值進行元學習，並使用基於梯度的元學習來處理優化問題，在更新對抗目標函數的外部最小化的的同時，做還對對初始化進行元學習。這樣作的好處在於用盡可能少的梯度步長來近似的內部優化問題。

爲了鼓勵元擾動生成集的多樣性，對於每一個元擾動，須要隨機分配一個目標，並執行有針對性的I-FGSM攻擊。這避免了許多擾動收斂到相似的模式，能夠愚弄模型預測相同的效果，還須要將隨機選擇的固定步長分配給每一個元擾動。

較大的步長對應於元擾動，元擾動更全局地探索容許的擾動空間，而較小的步長致使更細粒度的攻擊。

爲了可以更加清晰的展現出該論文中關於元對抗訓練的過程，綜合上述的算法介紹，我將論文中的算法流程圖進行了從新進行了整理，以下框圖所示：

實驗結果

魯棒性評估

該論文中的魯棒性評估方法實際上是擴展了於2018年Madry等人在PGD論文中的魯棒性評估的方法。具體公式以下所示：

根據上式利用蒙特卡洛則有以下的估計公式：

其中數據採樣，隨機向量。另外做者將隨機投影（S-PGD）的對抗擾動的公式定義爲：

定性定量結果

做者利用覆蓋大約佔比圖像14%（24x24像素）的通用Patch來評估魯棒性，而且對於每一個Patch從圖像中心最多隨機平移26個像素。每一個模型利用SGD訓練75輪，初始學習率爲0.033，學習衰減率設置爲0.9，Batch_Size爲128。

定量的結果以下圖所示爲對Tiny ImageNet（圖片尺寸的大小爲64x64，ImageNet的圖片大小爲256x256）分類器的攻擊成功率。

其中CL表明的是乾淨樣本數據，RI是帶有隨機初始化的Patch的樣本，DI是帶有裁剪的Patch的樣本，LF是低頻濾波器樣本，Tr是從其它模型中遷移過來的對抗樣本。能夠直觀的發現，該論文中提出的MAT是在防護對抗攻擊中效果最好的。

防護通用對抗Patch的定性的結果以下圖所示，在AT，SAT，UAT，以及本文提出的MAT的對抗訓練方法中，只用MAT起到了抵禦對抗攻擊的效果。

防護通用對抗擾動的定性的結果以下圖所示，在AT，SAT，UAT，以及本文提出的MAT的對抗訓練方法中，AT和MAT都完美的抵禦對抗攻擊。

總體綜合來看，MAT在抵禦通用對抗擾動中是最出色的。

論文：

https://arxiv.org/abs/2101.11453
代碼：

http://github.com/boschresearch/meta-adversarial-training

END

備註：對抗

對抗學習交流羣

掃碼備註拉你入羣。

我愛計算機視覺

微信號:aicvml

QQ羣:805388940

微博知乎:@我愛計算機視覺

投稿:amos@52cv.net

網站:www.52cv.net

在看，讓更多人看到

本文分享自微信公衆號 - 我愛計算機視覺（aicvml）。
若有侵權，請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」，歡迎正在閱讀的你也加入，一塊兒分享。