Speech Separation,Deep Clustering,PIT

首先呢,我們來看看什麼是Speech Separation問題。 人們可以在一個嘈雜的環境中識別出一個特定聲音的來源,這個叫做雞尾酒會效應。 這種應用到機器學習領域,我們要做的就是語音增強:語音-非語音分離(降噪)。 而Speech Separation就是做不同種類聲音的分離的識別工作。 那麼我們首先規定一下,本文主要討論兩種聲音,單一麥克風以及獨立的演講者(即培訓和測試演講者完全不同)的識別工
相關文章
相關標籤/搜索