基於端到端深度學習方法的語音喚醒模型和論文

語音喚醒,即關鍵詞檢索(keyword spotting, KWS)。用語音喚醒設備,讓設備由休眠狀態切換至工作狀態。 下面主要對基於端到端的深度學習方法的語音喚醒模型總結。 模型輸入爲語音,輸出爲各喚醒詞的概率,一個模型解決,不需要再進行解碼。 通常包括三個部分:第一步是特徵的提取,第二步是一個神經網絡,它的輸入是語音特徵,輸出是各個關鍵詞和非關鍵詞即Filler這樣一個後驗概率。由於第二步的網
相關文章
相關標籤/搜索