多粒度特徵融合的維度語音情感識別方法

主要內容:針對傳統維度語音情感識別系統採用全局統計特徵造成韻律學細節信息丟失以及特徵演化規律缺失的問題,提出了一種基於不同時間單元的多粒度特徵提取方法,提取短時幀粒度、中時段粒度和長時窗粒度特徵,並提出了一種可以融合多粒度特徵的基於認知機理的循環神經網絡CIRNN,使用不同時間單元的特徵參與網絡訓練,實現多層級信息融合。本文在VAM維度語料庫上進行實驗,得到平均相關係數0.66,優於傳統的ANN和
相關文章
相關標籤/搜索