加強模型魯棒性!博世提出元對抗訓練方法


介紹一篇對抗學習最新論文 Meta Adversarial Training ,做者來自德國博世公司。node



引言



深度學習模型中一個很致命的弱點就是它容易遭到對抗樣本攻擊。在真實物理世界中,通用對抗樣本能夠低成本的對深度模型進行對抗攻擊,這種對抗攻擊能夠在各類環境中欺騙模型。git


到目前爲止對抗訓練是針對對抗攻擊最有效的防護手段,但問題在於訓練對抗模型是一件成本很高的事情,並且防護通用對抗樣本難度會更大。github


在該論文中做者提出了一種元對抗訓練方式,它將對抗訓練和元學習的結合在一塊兒,不只下降訓練成本,並且大大提升了深度模型對通用對抗樣本的魯棒性。
web


背景介紹



通用對抗擾動於2017年的《Universal adversarial perturbations》中被首次提出。算法


通用對抗擾動與單一圖片的對抗擾動有很大的區別。通用對抗擾動最大的一個特色就是該擾動與輸入圖片無關,它與模型自己和整個數據集相關;微信


而單一圖片的對抗擾動只是針對於它的輸入圖片,對數據集其它的圖片攻擊性幾乎沒有。
網絡



如上圖所示,假若有一個動物數據集和經該數據集上訓練獲得神經網絡分類器,通過對抗攻擊生成了針對於該動物數據集和該模型的通用對抗擾動Universal perturbation。app


將該對抗擾動加在選取出的貓,狗,兔子,猴子,鳥的圖片,並輸入到分類器中,分類器所有分類出錯。
編輯器


模型介紹



假定 維向量數據點 和相應標籤 上的分佈, 爲待優化模型參數, 爲損失函數, 爲對抗擾動集合, 爲對數據點施加擾動 的函數, 爲隨機擾動向量。svg


對於通用對抗擾動,對抗擾動的集合表示爲:




對於通用Patch 擾動,函數 b表示爲:


   (1)

其中,mask爲 ,對抗擾動的空間爲 ,隨機變換


根據公式(1),做者從新定義了通用對抗損失爲:


    (2)

目的是找到使通用對抗損失最小化的模型參數即 ,這與標準對抗訓練的思路一致,即內部最大化(生成對抗樣本),外部最小化(利用對抗樣本更新模型參數)。


做者通用對抗擾動的初始值進行元學習,並使用基於梯度的元學習來處理優化問題 ,在更新對抗目標函數的外部最小化的 的同時,做還對對初始化 進行元學習。這樣作的好處在於用盡可能少的梯度步長來近似 的內部優化問題。


爲了鼓勵元擾動生成集的多樣性,對於每一個元擾動,須要隨機分配一個目標,並執行有針對性的I-FGSM攻擊。這避免了許多擾動收斂到相似的模式,能夠愚弄模型預測相同的效果,還須要將隨機選擇的固定步長 分配給每一個元擾動。


較大的步長對應於元擾動,元擾動更全局地探索容許的擾動空間,而較小的步長致使更細粒度的攻擊。


爲了可以更加清晰的展現出該論文中關於元對抗訓練的過程,綜合上述的算法介紹,我將論文中的算法流程圖進行了從新進行了整理,以下框圖所示:



實驗結果



魯棒性評估


該論文中的魯棒性評估方法實際上是擴展了於2018年Madry等人在PGD論文中的魯棒性評估的方法。具體公式以下所示:




根據上式利用蒙特卡洛則有以下的估計公式:



其中數據採樣 ,隨機向量 。另外做者將隨機投影(S-PGD)的對抗擾動的公式定義爲:




定性定量結果


做者利用覆蓋大約佔比圖像14%(24x24像素)的通用Patch來評估魯棒性,而且對於每一個Patch從圖像中心最多隨機平移26個像素。每一個模型利用SGD訓練75輪,初始學習率爲0.033,學習衰減率設置爲0.9,Batch_Size爲128。


定量的結果以下圖所示爲對Tiny ImageNet(圖片尺寸的大小爲64x64,ImageNet的圖片大小爲256x256)分類器的攻擊成功率。


其中CL表明的是乾淨樣本數據,RI是帶有隨機初始化的Patch的樣本,DI是帶有裁剪的Patch的樣本,LF是低頻濾波器樣本,Tr是從其它模型中遷移過來的對抗樣本。能夠直觀的發現,該論文中提出的MAT是在防護對抗攻擊中效果最好的。



防護通用對抗Patch的定性的結果以下圖所示,在AT,SAT,UAT,以及本文提出的MAT的對抗訓練方法中,只用MAT起到了抵禦對抗攻擊的效果。



防護通用對抗擾動的定性的結果以下圖所示,在AT,SAT,UAT,以及本文提出的MAT的對抗訓練方法中,AT和MAT都完美的抵禦對抗攻擊。



總體綜合來看,MAT在抵禦通用對抗擾動中是最出色的。


論文:

https://arxiv.org/abs/2101.11453
代碼:

http://github.com/boschresearch/meta-adversarial-training

END



備註:對抗

對抗學習交流羣

掃碼備註拉你入羣。

我愛計算機視覺

微信號:aicvml

QQ羣:805388940

微博知乎:@我愛計算機視覺

投稿:amos@52cv.net

網站:www.52cv.net

在看,讓更多人看到  

本文分享自微信公衆號 - 我愛計算機視覺(aicvml)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。

相關文章
相關標籤/搜索