2019icas--Cross-lingual Voice Conversion with Bilingual Phonetic PosteriorGram and Average Modeling

作者: Yizhou , HaizhouLi 單位:新加坡國立 & 南洋理工 abstract  用兩個單獨的語音識別系統訓練雙語的PPGs,conversion model學習雙語PPGs的關係以及對應的聲學特徵,爲了減少不同語種下說話者的干擾,從source和target 中挑選多個說話者作爲對象訓練average model(訓練asr or conversion?? )。I-vector作
相關文章
相關標籤/搜索