《Conditional Generative Adversarial Networks for Speech Enhancement and Noise-Robust Speaker Verifi》

摘要:在嘈雜環境中提高語音系統性能仍然是一項具有挑戰性的任務,語音增強(SE)是解決該問題的有效技術之一。由於生成對抗網絡(GAN)在各種圖像處理任務中的有發展前景的實驗結果,我們探索條件GAN(cGAN)對SE的潛力,特別是,我們利用Isola提出的圖像處理框架[1] ]學習從嘈雜語音的譜圖到增強對應物的映射。SEcGAN由兩個以對抗方式訓練的網絡組成:一個試圖增強輸入噪聲頻譜圖的生成器,以及一
相關文章
相關標籤/搜索