語音識別（二）——基本框架, Microphone Array, 聲源定位

時間 2021-01-17

原文原文鏈接

基本框架語音識別系統主要有四部分組成：信號處理和特徵提取、聲學模型、語言模型（Language Model, LM）和解碼器(Decoder)。信號處理和特徵提取部分以音頻信號爲輸入，通過消除噪音、信道失真等對語音進行增強，將語音信號從時域轉化到頻域，併爲後面的聲學模型提取合適的特徵。聲學模型將聲學和發音學的知識進行整合，以特徵提取模塊提取的特徵爲輸入，生成聲學模型得分。語言模型估計通過重

>>阅读原文<<