谷歌黑科技曝光:其 AI 語音合成幾乎與真人無異

12月28日消息,據國外媒體WCCF Tech報道,谷歌表示,其最新版本的人工智能(AI)語音合成系統Tacotron 2幾乎與真人聲音無法區分。該系統是谷歌的第二代語音轉文本技術,它有兩個深層的神經網絡,用於完美的輸出。 第一個深度神經網絡負責將文本轉換成頻譜圖(以視覺方式呈現音頻頻率,通常是PDF格式),然後將這個頻譜圖載入到第二個深度神經網絡WaveNet(來自Alphabet的AI研究實驗
相關文章
相關標籤/搜索