聲源分離之人聲與伴奏分離（人生艱難啊）

時間 2021-01-22

原文原文鏈接

之前做的工作，也是用的這個原理，但效果不太好，主要是場景複雜，並不是簡單的人聲唱歌，同時伴奏也清晰。很正常，在伴奏樂器較多的情況下，比如鼓和電聲等諸多混音（現在很多，也很正常），這種情況要麼有類似的訓練數據，要麼理論/原理上能解決這種問題。今天又重新整理了一下，感覺還是挺難了，訓練了2萬次左右吧，主要是訓練的數據場景簡單，而處理的對象複雜，所以效果不樂觀，這也在意料之中。如下示例：原聲立體聲，