WebRTC VAD算法初探

這幾天對webrtc中的VAD算法做了一些研究,有了一些心得 VAD算法中核心的是使用了GMM進行分類,noise作爲一類,speech作爲一類,兩類求後驗概率,並且實時的更新GMM的參數 但是這個GMM的具體情況是怎麼樣的,它的均值,方差,都是多少,使用特徵的維度是多少?參數又是怎麼更新的 一、GMM的 權重,均值,方差分析 頻率域上分成了6個子帶(channel),對每個子帶求能量,初始值有一
相關文章
相關標籤/搜索