Generative Adversarial Networks overview(4)

Libo1575899134@outlook.comhtml

Libo算法

(原創文章,轉發請註明做者)微信

本文章主要介紹Gan的應用篇,3,主要介紹圖像應用,4, 主要介紹文本以及醫藥化學其餘領域應用網絡

原理篇請看上兩篇框架

https://www.cnblogs.com/Libo-Master/p/11167804.html函數

https://www.cnblogs.com/Libo-Master/p/11169198.html學習

圖像應用大數據

https://www.cnblogs.com/Libo-Master/p/11187799.html編碼

-----------------------------------------------------------------------------------spa

本文主要介紹在文本和醫藥化學上的應用,其實惟一的化學式分子式是能夠經過一系列字符串表示的SEQ-GAN是第一個在文本中work的GAN,由上交的組作的,比較暴力的對離散不能求導的問題,用RL的Policy Gradient來解決,先介紹框架,把文本生成變成了加強學習的過程,獎勵在每次生成完完整的文本序列後,獲得一個Reward,這個Reward做爲這次加強學習的Reward,經過Reward不斷迭代策略,之因此要這麼作是由於直接把文本用在Gan中會出現剛纔說的問題,每次生成出來的文本是一個離散的序列,不論是漢字仍是英文是沒法直接求導的,好比沒法給梯度加減0.1獲得另一個字符,沒法在離散空間作字符的變換,不得不轉化到加強學習的框架來作,當時作的任務是唐詩宋詞五言的生成,基於奧巴馬演講生成的東西,還作了音符也能夠認爲是個離散序列。

後來有人也作了相關的改進,把Reward不是用到了加強學習中,而是用到了判別器獲得的score融合到了基於最大似然的訓練的目標函數中,變到了一個穩定的去求解過程。

如今微信也有不少接口,效果也比較好,是由於他們的工做加了不少特徵,手動feature,好比要求生成符合韻律的(平仄),都會編碼的生成過程當中的,還有些意向的映射好比山水都會編碼進去。

而後在PTB(一個經典的小數據集文本)的生成的一些句子,基於詞建模,一次生成了一些詞而不是句子,因此並不會有拼寫錯誤的狀況。大意都是在一個topic下的什麼事情。

下面是在一個大數據集上生成的結果,是基於improve-WGAN的基礎上作的,並無轉化到一個加強學習的框架下,是直接在特徵空間或者隱空間來處理這些文本,通常都是把原始的文本映射到一個連續的隱空間中,而後再經過一個連續的隱空間解碼成一個離散文本,這是通常的文本生成的過程。而後在解碼出來的離散空間來判別是真是假,須要用一些加強學習作(沒有辦法反向傳播的問題),可是若是在連續空間直接判別是真是假,直接能夠解決不能求導的問題,可是在連續空間作判別太簡單了,很容易判別出假樣本是假的,真樣本是真的,這會致使整個gan沒辦法訓練起來,由於是一個對抗過程,若是生成不了可以欺騙判別器的假樣本,生成器就永遠不能提升,訓練不起來,判別器也沒法提升本身,最終就失敗了,因此用了W-GAN 就可使得離散空間也能夠訓練判別器 ,不須要藉助加強學習,每次只生成一個字母 字符級別的,能夠建模語言信息了。

有了普通的文本生成,又作了一些條件的生成,生成一些跟給定文本相關的文本,相關就是在不一樣任務上體現,對話生成,既符合天然語言的話,又符合上下文邏輯的話,迴應用戶的對話,下面是一個問路的例子

下面是一個租房的例子。

下面是斯坦福博士的,把Adversarial traning 應用在了對話中,下面是解碼的結果,他們一樣把Gan的生成用到了加強學習中,加強學習具體有多種解法,不一樣的解法生成的文本長短和內容都會有較大的區別,有些時候生成反問句,有些時候會生成陳述句

後面有些人把對抗訓練,用在了機器翻譯的任務上,是今年微軟亞洲研究院的工做,下面加粗的文本是翻譯的結果,第二行是加了對抗訓練的結果,能夠看到加了對抗學習能夠減小拼寫錯誤,減小細微的語法錯誤,在細微流暢度上獲得提高。

下圖顯示了網絡結構,黃色爲生成器,紅色爲判別器,每次先生成假樣本,傳給判別器。得出80%爲真仍是20%爲真,這個reward,對於更新算法的強度有不一樣的影響。

能夠看到如今在NLP領域,對抗訓練主要作細微事情的調整,傳統的RNN或者LSTM在生成過程當中已經只能達到必定程度了,但加了對抗訓練的話能夠精益求精。

下面是生成符合某一類特性的文本,好比餐館的評價或者商品的評價,生成滿意的評價或者不滿意的。下面是CMU的工做。

 

他們是怎麼實現的呢?

加入了C,一個額外的變量去控制特徵,利用判別器去判別,有沒有符合判別器但願生成的特徵,最終生成出既知足語言又知足特徵。

如今controllable-gan 擴展到對話生成上,由於對話中會有不少隱含的情緒,溝通狀態,情緒如何,好比下命令和問問題的意圖不一樣的。

 

 未完

------------------------------------------- 

相關文章
相關標籤/搜索