Recurrent Neural Networks for Emotion Recognition in Video

時間 2020-12-29

原文原文鏈接

看這篇文章主要是看它如何融合多重特徵，如CNN提取特徵、聲音特徵、時序特徵融合一起來識別視頻中人臉表情。 Introduction：在表情類別之間大部分時候有很多重疊，使得識別表情很困難。在這篇論文中提出了建模不同特徵並結合到一起來推斷表情類別。使用AFEW5.0 dataset ，包含723個訓練視頻、383驗證視頻和539測試樣本。構建了一個CNN-RNN來對視頻中表情的時空變化建模，並且使

>>阅读原文<<