x-vector:Deep Neural Network Embeddings for Text-Independent Speaker Verification

會議:2017 interspeech 機構:The Johns Hopkins University 作者:David Snyder abstract  用dnn提取的embedding取代i-vector表示說話人特徵,對輸入的speech做時間池化, 用不同長度的語音訓練網絡,以區別說話人,句子對應定長的embeddding,成對的embedding用於PLDA打分。在NIST SRE201
相關文章
相關標籤/搜索