微軟人工智能語音技術只需小作訓練便可運做

時間 2019-12-05

原文原文鏈接

目前文字轉語音的技術已至關普及，因爲應用範圍普遍，很多科技公司努力開發新技術，帶來更天然流暢的效果。最近微軟就開發出只需少許訓練就可運做的人工智能語音技術。目前文字生成語音技術須要大量數據去訓練調整，才能達到天然效果，不過微軟最近開發的人工智能技術，可用 200 個聲音標本，也就是約 20 分鐘錄音，自動生成擬真度高的語音，比傳統技術節省很多時間。這次採用深度神經網絡技術，直接將輸入文字鏈接到聲音庫，生成語音更有效率，即便較複雜的文字也可快速生成。據研究人員指，雖然如今技術生成的語音仍未臻完美，但可讀性已達 99.84%，意味大多數狀況下，語音均可正確理解。新技術將讓文字生成語音的技術門坎大幅下降，就算是中小型公司，均可簡單製做本身的語音系統，無需投入大量資源。不過目前微軟仍然未推出使用這技術的相關產品，距離正式推出相信仍有一段時間。部分信息參考來源：仲博虛擬體驗館 pharmacycentral.net/