語音識別——MFCC理解

要看懂這篇文章要把數字信號處理學懂 在任意一個Automatic speech recognition 系統中,第一步就是提取特徵。換句話說,我們需要把音頻信號中具有辨識性的成分提取出來,然後把其他的亂七八糟的信息扔掉,例如背景噪聲啊,情緒啊等等。 搞清語音是怎麼產生的對於我們理解語音有很大幫助。人通過聲道產生聲音,聲道的shape(形狀?)決定了發出怎樣的聲音。聲道的shape包括舌頭,牙齒等。
相關文章
相關標籤/搜索