[生成對抗網絡] 論文研讀-SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient

時間 2020-12-30

標籤 nlp 欄目系統網絡简体版

原文原文鏈接

寫在前面 GAN作爲生成器已經在圖像方面大放異彩，然而在NLP方面的應用還不多，原因一部分在於GAN是爲連續空間設計的，而NLP是離散的，因此需要一點小小的trick纔可以work，SeqGAN這一篇文章將RL作爲鑑別器，用reward作爲梯度來指導生成器的學習，算是一種option 原文地址： https://arxiv.org/pdf/1609.05473.pdf 源代碼： https:/

>>阅读原文<<