VAD綜述

語音增強系列博文 VAD廣泛應用於語音編碼(網絡/無線/有線傳輸),說話認識和語音識別(ASR,基於機器學習的方法,也是經過VAD標註後的語音數據用於訓練的,準確標註真實場景的帶噪語音比較重要)。VAD的準確對前端算法也是比較關鍵的,這裏所說的是語音/非語音(非語音/靜音)檢測,一個VAD系統通常包括兩個部分,特徵提取和語音/非語音判決;常用的特徵提取可以分爲五類: 基於能量 頻域 倒譜 諧波 長
相關文章
相關標籤/搜索