語音識別(ASR)系列之二:混合模型

上篇系列之一從總體上講了ASR的原理、評估方法、模型發展,這一篇開始介紹稱霸ASR三十年的混合模型(Hybrid Model),特別是GMM/HMM模型。由於GMM和HMM模型本身已經是很大的一塊內容,我假設讀者已經瞭解其基本原理。 基本概念 在講具體模型之前,先介紹一些需要了解的基本概念。對語音進行處理,一般會先進行分幀和特徵提取,例如MFCC、FBank,然後把這些特徵轉化爲發音最基本單位的序
相關文章
相關標籤/搜索