實時語音通訊發展到今天,用戶對通話語音質量提出了愈來愈高的要求。因爲終端設備的多樣性以及使用場景的差別,聲音問題依然存在。傳統的音頻處理技術從聲音信號自己出發,挖掘其時頻特性,做出假設,創建物理模型,不少參數都須要人工進行精細化微調,比較費時費力。隨着AI技術的發展,憑藉着其強大的擬合能力,利用數據驅動,爲改善音頻體驗提供了更多的可能性。機器學習
關於理論部分,包括論文有不少,每種想法都存在一些問題,包括工程方面的,如需作落地,效果穩定良好,還須要作不少更多的工做,這裏稍微作了下總結,深度學習降噪基本都在這份分享的PPT上面,降噪部分有些文章可能有些不太新了,可是仍是有學習參考意義的。學習
此處就分享幾張DNN處理後的樣本,增長一下新手的信心,處理非平穩噪聲,效果仍是很是明顯的。spa
white:3d
destroyerengine:blog
n32:深度學習
n38it
n61:音頻
sil:百度
coffee:終端
PPT連接地址:
百度雲盤
連接: https://pan.baidu.com/s/1vvUiiGtu-HUdZwclBSInZA 提取碼: bsc5
實時語音通訊的總結和深度學習降噪資料均可以直接在QQ羣下載到
QQ羣:音頻信號處理讀書會 485186545
如上羣已滿,請加新羣: 音頻處理與機器學習 238816966