語音識別(二)——基本框架, Microphone Array, 聲源定位

基本框架 語音識別系統主要有四部分組成:信號處理和特徵提取、聲學模型、語言模型(Language Model, LM)和解碼器(Decoder)。 信號處理和特徵提取部分以音頻信號爲輸入,通過消除噪音、信道失真等對語音進行增強,將語音信號從時域轉化到頻域,併爲後面的聲學模型提取合適的特徵。 聲學模型將聲學和發音學的知識進行整合,以特徵提取模塊提取的特徵爲輸入,生成聲學模型得分。 語言模型估計通過重
相關文章
相關標籤/搜索