在上個博文中採用的hop_size=frame_size*3/4,這個效果如圖:第一個是沒有overlap
第二個圖是OLA後的圖,看起來比較好,但是聽起來還是有雜聲啊。。。我去,人生艱難啊。。。
而且處理時間是原來的3倍了,臥槽,這個不能忍啊。首先要確認,到底是不是分幀處理產生的,或者還是聲音處理沒做好?
實際應用中不可能那麼大的hopsize,最多一半已經夠了,不然沒法玩。
另外有相關問題可以加入QQ羣討論,不設微信羣
QQ羣:868373192
語音深度學習羣