GitHub標星近1萬:只需5秒音源,這個網絡就能實時「克隆」你的聲音

做者 | Google團隊git 譯者 | 凱隱github 編輯 | Jane安全 出品 | AI科技大本營(ID:rgznai100)網絡 本文中,Google 團隊提出了一種文本語音合成(text to speech)神經系統,能經過少許樣本學習到多個不一樣說話者(speaker)的語音特徵,併合成他們的講話音頻。此外,對於訓練時網絡沒有接觸過的說話者,也能在不從新訓練的狀況下,僅經過未知說
相關文章
相關標籤/搜索