StarGAN-VC語音音色轉換

StarGAN-VC是利用StarGAN的圖像到圖像翻譯原理,來實現「多對多」的非平行數據集下的語音音色轉換,其實質是對語音的梅爾能量進行轉換。 StarGAN-VC和StarGAN的不一樣之處:git StarGAN-VC加入了一致性損失(identity loss) StarGAN-VC將分類器獨立出來 StarGAN-VC在生成器和判別中都有鏈接說話人特徵向量的操做 StarGAN-VC使用
相關文章
相關標籤/搜索