GAN是一種特殊的損失函數？

時間 2019-12-11

標籤 gan 一種特殊損失函數简体版

原文原文鏈接

數據科學家Jeremy Howard在fast.ai的《生成對抗網絡（GAN）》課程中曾經講過這樣一句話：安全

「從本質上來講，生成對抗網絡（GAN）是一種特殊的損失函數。」網絡

你是否可以理解這句話的意思？讀完本文，你會更好的理解這句話的含義。架構

神經網絡的函數逼近理論app

在數學中，咱們能夠將函數看作一個「機器」或「黑匣子」，咱們爲這個「機器」或「黑匣子」提供了一個或多個數字做爲輸入，則會輸出一個或多個數字，以下圖所示：函數

將函數能夠比喻成一個「機器」或「黑匣子」性能

通常來講，咱們能夠用一個數學表達式來表示咱們想要的函數。可是，在一些特殊的狀況下，咱們就沒辦法將函數寫成一堆加法和乘法的明確組合，好比：咱們但願擁有這樣一個函數，即可以判斷輸入圖像的類別是貓仍是狗。學習

若是不能用明確的用數學表達式來表達這個函數，那麼，咱們能夠用某種方法近似表示嗎？編碼

這個近似方法就是神經網絡。通用近似定理代表，若是一個前饋神經網絡具備線性輸出層和至少一層隱藏層，只要給予網絡足夠數量的神經元，即可以表示任何一個函數。設計

具備4個隱藏單元的簡單神經網絡逼近函數視頻

做爲損失函數的神經網絡

如今，咱們但願設計一個貓和狗的分類器。但咱們沒辦法設計一個特別明確的分類函數，因此咱們另闢蹊徑，構建一個神經網絡，而後一步一步逐漸實現這一目標。

爲了更好的逼近，神經網絡須要知道距離目標到底還有多遠。咱們使用損失函數表示偏差。

如今，存在不少種類型的損失函數，使用哪一種損失函數則取決於手頭上的任務。而且，他們有一個共同的屬性，即這些損失函數必須可以用精確的數學表達式來表示，如：

1.L1損失函數（絕對偏差）：用於迴歸任務。

2.L2損失函數（均方偏差）：和L1損失函數相似，但對異常值更加敏感。

3.交叉熵損失函數：一般用於分類任務。

4.Dice係數損失函數：用於分割任務。

5.相對熵：又稱KL散度，用於測量兩個分佈之間的差別。

在構建一個性能良好的神經網絡時，損失函數很是有用。正確深刻的理解損失函數，並適時使用損失函數實現目標，是開發人員必備的技能之一。

如何設計一個好的損失函數，也是一個異常活躍的研究領域。好比：《密度對象檢測的焦點損失函數（Focal Loss）》中就設計了一種新的損失函數，稱爲焦點損失函數，能夠處理人臉檢測模型中的差別。

可明確表示損失函數的一些限制

上文提到的損失函數適用於分類、迴歸、分割等任務，可是若是模型的輸出具備多模態分佈，這些損失函數就派不上用場了。好比，對黑白圖像進行着色處理。

如上圖所示：

1.輸入圖像是個黑白鳥類圖像，真實圖像的顏色是藍色。

2.使用L2損失函數計算模型輸出的彩色圖像和藍色真實圖像之間的差別。

3.接下來，咱們有一張很是相似的黑白鳥類圖像，其真實圖像的顏色是紅色。

4.L2損失函數如今嘗試着將模型輸出的顏色和紅色的差別最小化。

5.根據L2損失函數的反饋，模型學習到：對於相似的鳥類，其輸出能夠接近紅色，也能夠接近藍色，那麼，到底應該怎麼作呢？

6.最後，模型輸出鳥類的顏色爲黃色，這就是處於紅色和藍色中間的顏色，而且是差別最小化的安全選擇，即使是模型之前從未見過黃色的鳥，它也會這樣作。

7.可是，天然界中沒有黃色的鳥類，因此模型的輸出並不真實。

使用MSE預測的下一幀圖像很是模糊

在不少狀況下，這種平均效果並不理想。舉個例子來講，若是須要模型預測視頻中下一個幀圖像，下一個幀有不少種可能，你確定但願模型輸出其中一種可能，然若是使用L1或L2損失函數，模型會將全部可能性平均化，輸出一個特別模型的平均圖像，這就和咱們的目標相悖。

生成對抗網絡——一種新的損失函數

若是咱們沒辦法用明確的數學表達式來表示這個損失函數，那麼，咱們就可使用神經網絡進行逼近，好比，函數接收一組數字，並輸出狗的真實圖像。

神經網絡須要使用損失函數來反饋當前結果如何，可是並無哪一個損失函數能夠很好的實現這一目標。

會不會有這樣一種方法？可以直接逼近神經網絡的損失函數，可是咱們不必知道其數學表達式是什麼，這就像一個「機器」或「黑匣子」，就跟神經網絡同樣。也就是說，若是使用一個神經網絡模型替換這個損失函數，這樣能夠嗎？

對，這就是生成對抗網絡（GAN）。

Vanilla-GAN架構

Alpha-GAN架構

咱們來看上面兩個圖，就能夠更好的理解損失函數。在上圖中，白色框表示輸入，粉色和綠色框表示咱們要構建的神經網絡，藍色表示損失函數。

在vanilla GAN中，只有一個損失函數，即判別器D，這自己就是一個特殊的神經網絡。

而在Alpha-GAN中，有3個損失函數，即輸入數據的判別器D，編碼潛在變量的潛在判別器C和傳統的像素級L1損失函數。其中，D和C不是明確的損失函數，而是一種逼近，即一個神經網絡。

梯度

若是使用損失函數訓練生成網絡（和Alpha-GAN網絡中的編碼器），那麼，應該使用哪一種損失函數來訓練判別器呢？

判別器的任務是區分實際數據分佈和生成數據分佈，使用監督的方式訓練判別器比較容易，如二元交叉熵。因爲判別器是生成器的損失韓式，這就意味着，判別器的二進制交叉熵損失函數產生的梯度也能夠用來更新生成器。

結論

考慮到神經網絡能夠代替傳統的損失函數，生成對抗網絡就實現了這一目標。兩個網絡之間的相互做用，可讓神經網絡執行一些之前沒法實現的任務，好比生成逼真的圖像等任務。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。