從雞尾酒會問題入門語音分離

前言 谷歌這篇文章《Looking to Listen at the Cocktail Party: A Speaker-Independent Audio-Visual Model for Speech Separation》,宣稱「攻克」了雞尾酒會問題。從提供的視頻演示來看,可以通過滑動控制只聽某一個人說話,非常神奇。 這篇文章本身大概講了這麼一個事: 提出一個視覺-聽覺聯合模型,通過視覺信息
相關文章
相關標籤/搜索