GAN半監督學習

時間 2020-12-30

原文原文鏈接

概述

GAN的發明者Ian Goodfellow2016年在Open AI任職期間發表了這篇論文，其中提到了GAN用於半監督學習(semi supervised)的方法。稱爲SSGAN。
作者給出了Theano+Lasagne實現。本文結合源碼對這種方法的推導和實現進行講解。1

考慮一個分類問題。
如果訓練集中大部分樣本沒有標記類別，只有少部分樣本有標記。則需要用半監督學習(semi-supervised)方法來訓練一個分類器。

wiki上的這張圖很好地說明了無標記樣本在半監督學習中發揮作用：

如果只考慮有標記樣本（黑白點），純粹使用監督學習。則得到垂直的分類面。
考慮了無標記樣本（灰色點）之後，我們對樣本的整體分佈有了進一步認識，能夠得到新的、更準確的分類面。

在半監督學習中運用GAN的邏輯如下。

舉個通俗的例子：就算沒人教認字，多練練分辨「是不是字」也對認字有好處。有粗糙的反饋，也比沒有反饋強。

GAN中的兩個核心模塊是生成器(Generator)和鑑別器(Discriminator)。這裏用分類器(Classifier)代替了鑑別器。

訓練集中包含有標籤樣本xlxl和無標籤樣本xuxu。
生成器從隨機噪聲生成僞樣本IfIf。
分類器接受樣本II，對於KK類分類問題，輸出K+1K+1維估計ll，再經過softmax函數得到概率pp：其前KK維對應原有KK個類，最後一維對應「僞樣本」類。
pp的最大值位置對應爲估計標籤yy。

$s o f t m a x (x i) = exp (x i) \sum j exp (x j) softmax(xi)=exp(xi)\sumjexp(xj)$

整個系統涉及三種誤差。

對於訓練集中的有標籤樣本，考察估計的標籤是否正確。即，計算分類爲相應的概率：

L l a b e l = - E [ln p (y | x)] Llabel=-E[lnp(y|x)]

對於訓練集中的無標籤樣本，考察是否估計爲「真」。即，計算不估計爲K+1K+1類的概率：

L u n l a b e l = - E [ln (1 - p (K + 1 | x))] Lunlabel=-E[ln(1-p(K+1|x))]

對於生成器產生的僞樣本，考察是否估計爲「僞」。即，計算估計爲K+1K+1類的概率：

L f a k e = - E [ln p (K + 1 | x)] Lfake=-E[lnp(K+1|x)]

考慮softmax函數的一個特性：

s o f t m a x (x i - c) = exp (x i - c) \sum j exp (x j - c) = exp (x i) / e x p (c) \sum j exp (x j) / exp (c) = s o f t m a x (x i) softmax(xi-c)=exp(xi-c)\sumjexp(xj-c)=exp(xi)/exp(c)\sumjexp(xj)/exp(c)=softmax(xi)

即，如果輸入各維減去同一個數，softmax結果不變。
於是，可以令 l→l−lK+1l→l−lK+1 ，有 lK+1=0lK+1=0 ， p=softmax(l)p=softmax(l) 保持不變。

期望號略去不寫，利用explK+1=1，exp⁡lK+1=1，後兩種代價變爲：

L u n l a b e l = - ln [1 - p (K + 1 | x)] = - ln [\sum K j = 1 exp l j \sum K j = 1 exp l j + exp l K + 1] = - ln [\sum j = 1 K exp l j] + ln [1 + \sum j = 1 K exp l j] Lunlabel=-ln[1-p(K+1|x)]=-ln[\sumj=1Kexplj\sumj=1Kexplj+explK+1]=-ln[\sumj=1Kexplj]+ln[1+\sumj=1Kexplj]

L f a k e = - ln [p (K + 1 | x)] = ln [1 + \sum j = 1 K exp l j] Lfake=-ln[p(K+1|x)]=ln[1+\sumj=1Kexplj]

上述推導可以讓我們省去lK+1lK+1，讓分類器仍然輸出K維的估計ll。

對於第一個代價，由於分類器輸入必定來自前K類，所以可以直接使用ll的前K維：

L l a b e l = - ln [p (y | x, y < K + 1)] = - ln [exp l y \sum K j = 1 exp l j] = - l y + ln [\sum j = 1 K exp l j] Llabel=-ln[p(y|x,y<K+1)]=-ln[exply\sumj=1Kexplj]=-ly+ln[\sumj=1Kexplj]

引入兩個函數，使得書寫更爲簡潔：

$L S E (x) = ln [\sum j = 1 exp x j] LSE(x)=ln[\sumj=1expxj]$

$s o f t p l u s (x) = ln (1 + exp x) softplus(x)=ln(1+expx)$

三個誤差：

L l a b e l = - l y + L S E (l) Llabel=-ly+LSE(l)

L u n l a b e l = - L S E (l) + s o f t p l u s (L S E (l)) Lunlabel=-LSE(l)+softplus(LSE(l))

L f a k e = s o f t p l u s (L S E (l)) Lfake=softplus(LSE(l))

對於分類器來說，希望上述誤差儘量小。引入權重ww，得到分類器優化目標：

w w ，得到 分類器優化目標 ： L D = L l a b e l + w 2 (L u n l a b e 2 (L u n l a b e l + L f a k e) LD=Llabel+w2(Lunlabel+Lfake) 對於生成器來說，希望其輸出的僞樣本能夠騙過分類器。 生成器優化目標 與分類器的第三項相反： L l a b e l

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。