StarGAN-VC語音音色轉換

時間 2020-07-25

原文原文鏈接

StarGAN-VC是利用StarGAN的圖像到圖像翻譯原理，來實現「多對多」的非平行數據集下的語音音色轉換，其實質是對語音的梅爾能量進行轉換。 StarGAN-VC和StarGAN的不一樣之處：git StarGAN-VC加入了一致性損失（identity loss) StarGAN-VC將分類器獨立出來 StarGAN-VC在生成器和判別中都有鏈接說話人特徵向量的操做 StarGAN-VC使用

>>阅读原文<<