生動化你的表達——DuerOS中的SSML應用

時間 2021-01-16

原文原文鏈接

在對話式AI系統中，語音交互是主要的輸入輸出方式。對語音輸出而言，有兩種主要的方法，一種是事先製作好音頻，然後根據用戶的請求，播放音頻；另一種是通過語音合成中的TTS技術，將文本轉化爲語音。在很多情況下，製作的音頻往往要比語音合成的用戶體驗要好，因爲人的聲音中有更多的「色彩」，語音語調中可以有更多的情緒。但是，預先製作的工作量往往較大，而且由於預製的確定性，導致輸出內容的動態性較弱。按需定製，動