基於端到端深度學習方法的語音喚醒模型和論文

時間 2020-12-30

原文原文鏈接

語音喚醒，即關鍵詞檢索（keyword spotting, KWS）。用語音喚醒設備，讓設備由休眠狀態切換至工作狀態。下面主要對基於端到端的深度學習方法的語音喚醒模型總結。模型輸入爲語音，輸出爲各喚醒詞的概率，一個模型解決，不需要再進行解碼。通常包括三個部分：第一步是特徵的提取，第二步是一個神經網絡，它的輸入是語音特徵，輸出是各個關鍵詞和非關鍵詞即Filler這樣一個後驗概率。由於第二步的網