聲紋識別之xvector

TDNN 時延神經網絡(TDNN)來自1989年的論文《Phoneme recognition using time-delay neural networks》。原文中主要使用TDNN來識別音素,在識別"B", "D", "G"三個濁音中得到98.5%的準確率,高於HMM的93.7%。 普通神經網絡識別音素 在講TDNN之前先說說一般的神經網絡的是怎樣識別音素的吧。假設要識別三個輔音"B", "
相關文章
相關標籤/搜索