科普|自動語音識別（ASR）技術的原理及過程，語音識別接口邏輯

時間 2021-01-08

原文原文鏈接

我們介紹了智能語音識別技術的整體過程，共分爲ASR、NLP、TTS三大步。本文我們對ASR過程進行進一步解析。 ASR（自動語音識別）就是將麥克風採集到的自然聲音轉化爲文字的過程，相當於人的耳朵+大腦（一部分）。下圖是機器識別人類的語音輸入（亦即ASR）博主多年操作經驗發現的原理和過程：第一步：建立聲學模型。對於同一個單詞或漢字，由於不同人的發音、語調、語速等各不相同，比如男人和女人的、大人和小