語音中的關於語音識別的一些知識

以下內容都是抄的,哈哈哈 1.mel頻率: 是模擬人耳對不同頻率語音的感知。 人類對不同頻率語音有不同的感知能力:對1kHz以下,與頻率成線性關係,對1kHz以上,與頻率成對數關係。頻率越高,感知能力就越差了。因此,在應用中常常只使用低頻MFCC,而丟棄中高頻MFCC。 在Mel頻域內,人對音調的感知能力爲線性關係,如果兩段語音的Mel頻率差兩倍,則人在感知上也差兩倍。 轉換公式:B(f)=112
相關文章
相關標籤/搜索