Continuous Estimation of Emotions in Speech by Dynamic Cooperative Speaker Models

時間 2021-01-04

原文原文鏈接

研究方向由離散語音情感分類轉變爲連續語音情感識別了，首先需要了解這二者的區別。從分類問題轉爲迴歸問題，以便能夠對連續的情感維度進行建模片段級別的情感標籤轉換爲時間連續標籤連續語音情感識別面對的問題：缺乏可靠的來自評估羣體的黃金標準面臨訓練模型過程中數據稀缺性的問題對於問題一，目前常通過最大化相關係數或視聽特徵與情感評分的互信息估計RL模型。對於問題二，文獻中通常使用SVR進行情感預測；