如何使用對比預測編碼提升語音情感識別性能?

全文共4925字,預計學習時長13分鐘   圖源:unsplash 本文中,筆者將分享如何開發一個語音輸入情感識別系統,並使用對比預測編碼(CPC)訓練的自我監督演示提升性能。使用CPC時,結果準確性從基線的71%提高到80%。這是顯著的相對減低率,誤差在30%。   此外,筆者對使用這些演示訓練模型的各種體系結構進行了基準測試,包括簡單多層感知器(MLPs)、遞歸神經網絡(RNNs)和使用擴展卷
相關文章
相關標籤/搜索