[生成對抗網絡] 論文研讀-SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient

寫在前面 GAN作爲生成器已經在圖像方面大放異彩,然而在NLP方面的應用還不多,原因一部分在於GAN是爲連續空間設計的,而NLP是離散的,因此需要一點小小的trick纔可以work,SeqGAN這一篇文章將RL作爲鑑別器,用reward作爲梯度來指導生成器的學習,算是一種option 原文地址 : https://arxiv.org/pdf/1609.05473.pdf 源代碼 : https:/
相關文章
相關標籤/搜索