Speech Separation,Deep Clustering，PIT

時間 2020-12-24

原文原文鏈接

首先呢，我們來看看什麼是Speech Separation問題。人們可以在一個嘈雜的環境中識別出一個特定聲音的來源，這個叫做雞尾酒會效應。這種應用到機器學習領域，我們要做的就是語音增強：語音-非語音分離（降噪）。而Speech Separation就是做不同種類聲音的分離的識別工作。那麼我們首先規定一下，本文主要討論兩種聲音，單一麥克風以及獨立的演講者（即培訓和測試演講者完全不同）的識別工