目前文字轉語音的技術已至關普及,因爲應用範圍普遍,很多科技公司努力開發新技術,帶來更天然流暢的效果。最近微軟就開發出只需少許訓練就可運做的人工智能語音技術。目前文字生成語音技術須要大量數據去訓練調整,才能達到天然效果,不過微軟最近開發的人工智能技術,可用 200 個聲音標本,也就是約 20 分鐘錄音,自動生成擬真度高的語音,比傳統技術節省很多時間。這次採用深度神經網絡技術,直接將輸入文字鏈接到聲音庫,生成語音更有效率,即便較複雜的文字也可快速生成。據研究人員指,雖然如今技術生成的語音仍未臻完美,但可讀性已達 99.84%,意味大多數狀況下,語音均可正確理解。新技術將讓文字生成語音的技術門坎大幅下降,就算是中小型公司,均可簡單製做本身的語音系統,無需投入大量資源。不過目前微軟仍然未推出使用這技術的相關產品,距離正式推出相信仍有一段時間。部分信息參考來源:仲博虛擬體驗館
pharmacycentral.net/