speaker vector

ivector ivector包含了說話者和聲道的信息,每一幀提取出若干維特徵,然後做長度歸一化,再通過LDA/PLDA消除聲道信息,只保留說話者信息。 關於LDA和PLDA的算法描述 LDA:線性分類器–基本原理是將帶上標籤的數據(點),通過投影的方法,投影到維度更低的空間中,使得投影后的點,會形成按類別區分,一簇一簇的情況,相同類別的點,將會在投影后的空間中更接近。 xvector 從stag
相關文章
相關標籤/搜索