數據科學家Jeremy Howard在fast.ai的《生成對抗網絡(GAN)》課程中曾經講過這樣一句話:安全
「從本質上來講,生成對抗網絡(GAN)是一種特殊的損失函數。」網絡
你是否可以理解這句話的意思?讀完本文,你會更好的理解這句話的含義。架構
神經網絡的函數逼近理論app
在數學中,咱們能夠將函數看作一個「機器」或「黑匣子」,咱們爲這個「機器」或「黑匣子」提供了一個或多個數字做爲輸入,則會輸出一個或多個數字,以下圖所示:函數
將函數能夠比喻成一個「機器」或「黑匣子」性能
通常來講,咱們能夠用一個數學表達式來表示咱們想要的函數。可是,在一些特殊的狀況下,咱們就沒辦法將函數寫成一堆加法和乘法的明確組合,好比:咱們但願擁有這樣一個函數,即可以判斷輸入圖像的類別是貓仍是狗。學習
若是不能用明確的用數學表達式來表達這個函數,那麼,咱們能夠用某種方法近似表示嗎?編碼
這個近似方法就是神經網絡。通用近似定理代表,若是一個前饋神經網絡具備線性輸出層和至少一層隱藏層,只要給予網絡足夠數量的神經元,即可以表示任何一個函數。設計
具備4個隱藏單元的簡單神經網絡逼近函數視頻
做爲損失函數的神經網絡
如今,咱們但願設計一個貓和狗的分類器。但咱們沒辦法設計一個特別明確的分類函數,因此咱們另闢蹊徑,構建一個神經網絡,而後一步一步逐漸實現這一目標。
爲了更好的逼近,神經網絡須要知道距離目標到底還有多遠。咱們使用損失函數表示偏差。
如今,存在不少種類型的損失函數,使用哪一種損失函數則取決於手頭上的任務。而且,他們有一個共同的屬性,即這些損失函數必須可以用精確的數學表達式來表示,如:
1.L1損失函數(絕對偏差):用於迴歸任務。
2.L2損失函數(均方偏差):和L1損失函數相似,但對異常值更加敏感。
3.交叉熵損失函數:一般用於分類任務。
4.Dice係數損失函數:用於分割任務。
5.相對熵:又稱KL散度,用於測量兩個分佈之間的差別。
在構建一個性能良好的神經網絡時,損失函數很是有用。正確深刻的理解損失函數,並適時使用損失函數實現目標,是開發人員必備的技能之一。
如何設計一個好的損失函數,也是一個異常活躍的研究領域。好比:《密度對象檢測的焦點損失函數(Focal Loss)》中就設計了一種新的損失函數,稱爲焦點損失函數,能夠處理人臉檢測模型中的差別。
可明確表示損失函數的一些限制
上文提到的損失函數適用於分類、迴歸、分割等任務,可是若是模型的輸出具備多模態分佈,這些損失函數就派不上用場了。好比,對黑白圖像進行着色處理。
如上圖所示:
1.輸入圖像是個黑白鳥類圖像,真實圖像的顏色是藍色。
2.使用L2損失函數計算模型輸出的彩色圖像和藍色真實圖像之間的差別。
3.接下來,咱們有一張很是相似的黑白鳥類圖像,其真實圖像的顏色是紅色。
4.L2損失函數如今嘗試着將模型輸出的顏色和紅色的差別最小化。
5.根據L2損失函數的反饋,模型學習到:對於相似的鳥類,其輸出能夠接近紅色,也能夠接近藍色,那麼,到底應該怎麼作呢?
6.最後,模型輸出鳥類的顏色爲黃色,這就是處於紅色和藍色中間的顏色,而且是差別最小化的安全選擇,即使是模型之前從未見過黃色的鳥,它也會這樣作。
7.可是,天然界中沒有黃色的鳥類,因此模型的輸出並不真實。
使用MSE預測的下一幀圖像很是模糊
在不少狀況下,這種平均效果並不理想。舉個例子來講,若是須要模型預測視頻中下一個幀圖像,下一個幀有不少種可能,你確定但願模型輸出其中一種可能,然若是使用L1或L2損失函數,模型會將全部可能性平均化,輸出一個特別模型的平均圖像,這就和咱們的目標相悖。
生成對抗網絡——一種新的損失函數
若是咱們沒辦法用明確的數學表達式來表示這個損失函數,那麼,咱們就可使用神經網絡進行逼近,好比,函數接收一組數字,並輸出狗的真實圖像。
神經網絡須要使用損失函數來反饋當前結果如何,可是並無哪一個損失函數能夠很好的實現這一目標。
會不會有這樣一種方法?可以直接逼近神經網絡的損失函數,可是咱們不必知道其數學表達式是什麼,這就像一個「機器」或「黑匣子」,就跟神經網絡同樣。也就是說,若是使用一個神經網絡模型替換這個損失函數,這樣能夠嗎?
對,這就是生成對抗網絡(GAN)。
Vanilla-GAN架構
Alpha-GAN架構
咱們來看上面兩個圖,就能夠更好的理解損失函數。在上圖中,白色框表示輸入,粉色和綠色框表示咱們要構建的神經網絡,藍色表示損失函數。
在vanilla GAN中,只有一個損失函數,即判別器D,這自己就是一個特殊的神經網絡。
而在Alpha-GAN中,有3個損失函數,即輸入數據的判別器D,編碼潛在變量的潛在判別器C和傳統的像素級L1損失函數。其中,D和C不是明確的損失函數,而是一種逼近,即一個神經網絡。
梯度
若是使用損失函數訓練生成網絡(和Alpha-GAN網絡中的編碼器),那麼,應該使用哪一種損失函數來訓練判別器呢?
判別器的任務是區分實際數據分佈和生成數據分佈,使用監督的方式訓練判別器比較容易,如二元交叉熵。因爲判別器是生成器的損失韓式,這就意味着,判別器的二進制交叉熵損失函數產生的梯度也能夠用來更新生成器。
結論
考慮到神經網絡能夠代替傳統的損失函數,生成對抗網絡就實現了這一目標。兩個網絡之間的相互做用,可讓神經網絡執行一些之前沒法實現的任務,好比生成逼真的圖像等任務。