speaker vector

時間 2021-01-02

原文原文鏈接

ivector ivector包含了說話者和聲道的信息，每一幀提取出若干維特徵，然後做長度歸一化，再通過LDA/PLDA消除聲道信息，只保留說話者信息。關於LDA和PLDA的算法描述 LDA：線性分類器–基本原理是將帶上標籤的數據（點），通過投影的方法，投影到維度更低的空間中，使得投影后的點，會形成按類別區分，一簇一簇的情況，相同類別的點，將會在投影后的空間中更接近。 xvector 從stag

>>阅读原文<<