對 GAN 的 value function 的理解
![](http://static.javashuo.com/static/loading.gif)
上式分爲兩個步驟:網絡
- 第一步:調整discriminative model D的權重,使得V中兩項取得最大值
- 第二步:調整generative model G的權重,使得V中第二項取得最小值
首先,分析log D(x)的含義:blog
- D(x)表示discriminative model D對一個原始樣本的評分,評分越高,表示D越趨向於相信該樣本是一個真實樣本
- D(G(z))表示discriminative model D對一個生成樣本的評分,評分越高,表示D越趨向於把一個生成樣本當成了一個真實樣本
所以,網絡訓練過程總結以下:model
- 第一步:訓練D,使得上述兩個指望最大
- 第一項指望值最大,表示D將一個真實樣本給出一個高的評分
- 第二項指望值最大,表示D將一個生成樣本給出一個低分
第二步:訓練G,使得指望值的第二項最小
- 第二項指望值最小,即:找到一個G,使其生成的樣本可以在discriminative model D中得到一個較高的評分
圖:GAN的訓練收斂過程im
![](http://static.javashuo.com/static/loading.gif)
藍色表示D總結
綠色表示G數據
黑色表示原數據img
2019年8月18日di
於南湖畔co
歡迎關注本站公眾號,獲取更多信息