科普|自動語音識別(ASR)技術的原理及過程,語音識別接口邏輯

我們介紹了智能語音識別技術的整體過程,共分爲ASR、NLP、TTS三大步。本文我們對ASR過程進行進一步解析。 ASR(自動語音識別)就是將麥克風採集到的自然聲音轉化爲文字的過程,相當於人的耳朵+大腦(一部分)。下圖是機器識別人類的語音輸入(亦即ASR)博主多年操作經驗發現的原理和過程: 第一步:建立聲學模型。對於同一個單詞或漢字,由於不同人的發音、語調、語速等各不相同,比如男人和女人的、大人和小
相關文章
相關標籤/搜索