Continuous Estimation of Emotions in Speech by Dynamic Cooperative Speaker Models

研究方向由離散語音情感分類轉變爲連續語音情感識別了,首先需要了解這二者的區別。 從分類問題轉爲迴歸問題,以便能夠對連續的情感維度進行建模 片段級別的情感標籤轉換爲時間連續標籤 連續語音情感識別面對的問題: 缺乏可靠的來自評估羣體的黃金標準 面臨訓練模型過程中數據稀缺性的問題 對於問題一,目前常通過最大化相關係數或視聽特徵與情感評分的互信息估計RL模型。對於問題二,文獻中通常使用SVR進行情感預測;
相關文章
相關標籤/搜索