語音識別基本流程

所謂語音識別,就是將一段語音信號轉換成相對應的文本信息,系統主要包含特徵提取、聲學模型,語言模型以及字典與解碼四大部分,此外爲了更有效地提取特徵每每還須要對所採集到的聲音信號進行濾波、分幀等音頻數據預處理工做,將須要分析的音頻信號從原始信號中合適地提取出來;特徵提取工做將聲音信號從時域轉換到頻域,爲聲學模型提供合適的特徵向量;聲學模型中再根據聲學特性計算每個特徵向量在聲學特徵上的得分;而語言模型則
相關文章
相關標籤/搜索