End-to-End簡介

簡介 1、非端到端學習(傳統的語音識別系統) 傳統的語音識別需要把語音轉換成語音特徵向量,然後把這組向量通過機器學習,分類到各種音節上(根據語言模型),然後通過音節,還原出最大概率的語音原本要表達的單詞,一般包括以下模塊: 特徵提取模塊 (Feature Extraction):該模塊的主要任務是從輸入信號中提取特徵,供聲學模型處理。一般也包括了一些信號處理技術,儘可能降低環境噪聲、說話人等因素對
相關文章
相關標籤/搜索