Generative Adversarial Text to Image Synthesis --- 根據文字描述生成對應的圖片

時間 2020-12-30

原文原文鏈接

總說簡單的說就是根據文字進行生成相應的圖片。先看效果：架構這裏首先用一個 text embedding網絡來將文字轉換爲向量， ϕ(t) 是1024維的向量，然後投影成128。並將這128向量分別加入到G和D網絡中。在G中直接concat到後面，而D中由於中間出來的是spatial size是4x4大小的，所以直接複製4x4份，後面concat上去。因爲普通的GAN就是一個 z 直接生成

>>阅读原文<<