技術實操丨SoundNet遷移學習之由聲音分類到語音情感識別

摘要:聲音也是識別對象的一種重要數據源。其中根據聲音來識別聲音所處的環境也是語音識別的研究內容之一。 一、思路 1、SoundNet模型在視頻數據中先預訓練,視頻任務可能是場景識別,可參考這篇文章SoundNet: Learning Sound Representations from Unlabeled Video。 2、遷移學習:5層的soundnet只取前3層作爲遷移層,在新數據集中訓練時保
相關文章
相關標籤/搜索