SPEAKER-AWARE SPEECH-TRANSFORMER

單位:中科院自動化所 作者:fanzhiyun 會議:2019 ASRU abstract e2e-ASR存在的問題是train和test的說話人mismatch的問題,做法是:在speech-Transformer的基礎上加speaker attention module. SAM有一個i-vector組成的固定的speaker knowledge block,每個時間步,encoder out
本站公眾號
   歡迎關注本站公眾號,獲取更多信息