多重信號輔助音頻分離,讓你在嘈雜環境也能指哪聽哪兒

在剛剛結束的 I/O 大會的主題演講中,Google CEO Sundar 提出了機器學習在無障礙(Accessibility)方面的用例:有聽覺障礙的人在觀看視頻時往往需要配合字幕來完成輔助理解,但是如果你遇到了多個人同時在說話,自動生成的字幕反倒會擾亂聽障人士的思維,使得他們更不知其所云。 有了我們稱之爲 Looking to Listen 的機器學習技術之後,我們通過對視頻信號的處理和分析,
相關文章
相關標籤/搜索