【贊】【轉】CUI三部曲之語音識別——機器如何理解你的話?

在智能時代,以對話爲主要交互形式的CUI會應用到越來越多的場景中。進行對話交互時,機器往往需要完成「聽懂——理解——回答」的閉環。這個閉環涉及到三類技術:語音識別(ASR)、自然語言處理(NLP)以及語音合成(TTS)。 語音識別的任務是將用戶所說的話從聲音形式轉變爲文字形式,自然語言處理則是理解這些文字所要表達的意思(語義)。理解了用戶的意圖之後,機器同樣會以語音的形式給出相應的回答,這就需要用
相關文章
相關標籤/搜索