解碼器之特徵提取

特徵提取(fbank) 目的: 1.把每一幀波形變成一個包含聲音信息的多維向量; 2. 能夠符合或類似人耳的聽覺感知特性 3. 在一定程度上能夠增強語音信號、抑制非語音信號 fbank fbank的總體流程可以由下圖表示,去掉(DCT)。 1.語音採樣率: 語音採樣率顧名思義就是在一秒長的音頻上採樣多少個幅值點。根據採樣定理採樣率要大於採樣信號的兩倍,才能還原原始信號信息。人聲信號人聲一般在300
相關文章
相關標籤/搜索