基於聲紋識別的語音分離 VOICE FILTER: TARGETED VOICE SEPARATION (BY SPEAKER-CONDITIONED SPECTROGRAM MASKING)

原文連接:https://arxiv.org/pdf/1810.04826.pdf 結果連接: https://google.github.io/speaker-id/publications/VoiceFilter 摘要     在這篇文章中,我們提出了一個通過參考音頻實現音頻分離的系統。我們通過兩個獨立的網絡來實現這個目的。(1)聲紋識別網絡用於生成離散的發音者特徵。(2)譜掩碼網絡:通過輸入
相關文章
相關標籤/搜索