生動化你的表達——DuerOS中的SSML應用

在對話式AI系統中,語音交互是主要的輸入輸出方式。對語音輸出而言,有兩種主要的方法,一種是事先製作好音頻,然後根據用戶的請求,播放音頻;另一種是通過語音合成中的TTS技術,將文本轉化爲語音。在很多情況下,製作的音頻往往要比語音合成的用戶體驗要好,因爲人的聲音中有更多的「色彩」,語音語調中可以有更多的情緒。 但是,預先製作的工作量往往較大,而且由於預製的確定性,導致輸出內容的動態性較弱。按需定製,動
相關文章
相關標籤/搜索