Generative Adversarial Text to Image Synthesis --- 根據文字描述生成對應的圖片

總說 簡單的說就是根據文字進行生成相應的圖片。 先看效果: 架構 這裏首先用一個 text embedding網絡來將文字轉換爲向量, ϕ(t) 是1024維的向量,然後投影成128。並將這128向量分別加入到G和D網絡中。在G中直接concat到後面,而D中由於中間出來的是spatial size是4x4大小的,所以直接複製4x4份,後面concat上去。 因爲普通的GAN就是一個 z 直接生成
相關文章
相關標籤/搜索