聲源分離之人聲與伴奏分離(人生艱難啊)

之前做的工作,也是用的這個原理,但效果不太好,主要是場景複雜,並不是簡單的人聲唱歌,同時伴奏也清晰。 很正常,在伴奏樂器較多的情況下,比如鼓和電聲等諸多混音(現在很多,也很正常),這種情況要麼有類似的訓練數據,要麼理論/原理上能解決這種問題。今天又重新整理了一下,感覺還是挺難了,訓練了2萬次左右吧,主要是訓練的數據場景簡單,而處理的對象複雜,所以效果不樂觀,這也在意料之中。如下示例: 原聲立體聲,
相關文章
相關標籤/搜索