語音識別(ASR)系列之二：混合模型

時間 2021-01-18

原文原文鏈接

上篇系列之一從總體上講了ASR的原理、評估方法、模型發展，這一篇開始介紹稱霸ASR三十年的混合模型(Hybrid Model)，特別是GMM/HMM模型。由於GMM和HMM模型本身已經是很大的一塊內容，我假設讀者已經瞭解其基本原理。基本概念在講具體模型之前，先介紹一些需要了解的基本概念。對語音進行處理，一般會先進行分幀和特徵提取，例如MFCC、FBank，然後把這些特徵轉化爲發音最基本單位的序

>>阅读原文<<