說話人識別中訓練通用背景模型(UBM)的研究

摘要:       以高斯分佈爲基礎的說話人識別系統使用通用背景的模型(UBM)需要廣泛的數據資源尤其是多信道和多個麥克風種類下采集語音。本研究主要是對訓練UBM模型數據的選擇對整個系統性能的影響做一個系統的分析,訓練UBM模型時選擇的數據的方式主要涉及下面幾個方面:數據數目的改變、特徵幀的子樣本結構、說話人數量的改變。UBM的協方差矩陣和系統性能有高度相關性,因此主要通過計算UBM協方差矩陣看系
相關文章
相關標籤/搜索