對 GAN 的 value function 的理解

 

 


上式分爲兩個步驟:網絡

  • 第一步:調整discriminative model D的權重,使得V中兩項取得最大值
  • 第二步:調整generative model G的權重,使得V中第二項取得最小值

首先,分析log D(x)的含義:blog

  • D(x)表示discriminative model D對一個原始樣本的評分,評分越高,表示D越趨向於相信該樣本是一個真實樣本
  • D(G(z))表示discriminative model D對一個生成樣本的評分,評分越高,表示D越趨向於把一個生成樣本當成了一個真實樣本

所以,網絡訓練過程總結以下:model

  • 第一步:訓練D,使得上述兩個指望最大
    • 第一項指望值最大,表示D將一個真實樣本給出一個高的評分
    • 第二項指望值最大,表示D將一個生成樣本給出一個低分
  • 第二步:訓練G,使得指望值的第二項最小
    • 第二項指望值最小,即:找到一個G,使其生成的樣本可以在discriminative model D中得到一個較高的評分

 

圖:GAN的訓練收斂過程im

藍色表示D總結

綠色表示G數據

黑色表示原數據img


 

2019年8月18日di

於南湖畔co

相關文章
相關標籤/搜索