GAN系列(五) —— Text2Img文本生成圖像

文本生成圖像的GAN網絡結構   文本生成圖像的問題難點 多樣化 一個描述對應多張圖,搜索空間比圖像生成文本更大 一個詞的變化圖就會發生很大的變化   文本生成圖像的任務 生成真實的圖像 生成與文字匹配的圖像     模型結構 G 輸入:隨機向量+文本編碼 輸出:圖像 D 輸入:生成圖像+文本編碼 輸出:圖像與文本是否匹配+圖像是否真實 文本是向量,不能當作圖像來處理,這是和其他GAN不同的一個地
相關文章
相關標籤/搜索