一、提取有效的聲音信息
二、從有效信息識別身份
三、聲音信號轉換成電信號數據庫
經過語音信息與實際內容進行匹配網絡
智能理解用戶的需求機器學習
一、語音預處理(語音信號採樣、反混疊帶通濾波、去除個體發音差別和設備、環境引發的噪聲影響等)
二、聲波------>電信號------>二進制
三、語音識別只能找到與說話者發音最爲類似的字音。在判斷類似性時 ,咱們首先須要設定好標準讀函數
比較兩個向量之間的夾角大小 ,把特徵分析提取的一組隨時間而變的特徵矢量序列和事先經過學習後存在機器裏樣本序列進行比較。咱們將兩個向量相乘再除以他們各自的模獲得他們之間的夾角 ,夾角越小 ,向量之間也就越爲類似 ,從而語音識別得以找到最接近每一個人發音的字形。(模板匹配法、隱馬爾夫法 (HMM) 和神經網絡法 (ANN)學習
一、訓練
首先 ,咱們人爲的將不一樣的聲波匹配成不一樣的特徵向量 ,並將它們輸入到語音識別內部的計算機內 ,這樣語音識別就擁有了一個初步的詞組庫 ,隨後以詞組庫爲基礎 ,創建一個可以分類這些詞組的模型
二、學習
識別出的詞組數據用來完善數據庫cdn
分詞斷句(貝葉斯原理)blog
模擬信號———>採樣———>量化———>數字信號
採樣:離散的序列表明採樣函數,將音頻波形分紅若干等分。
量化:量化採用數字化的方法來反映出聲波電壓值的大小。以bit爲單位。在量化的過程當中須要作好失真處理,通常咱們使用提升採樣頻率和增長量化精度。it
在識別過程當中使幀與幀之間語音信號從模擬信號到數字信號轉變是過渡平穩,且可以保持一種連續性。採用交叉識別重疊的方式進行分幀處理io
肯定語音的開始和終止。(時域處理,頻域分析)入門
本文參考文獻[1]詹新明,黃南山,楊燦.語音識別技術研究進展[J].現代計算機(專業版)[2]《語音識別》——維基百科,自由百科的全書[3]楊行峻, 遲惠生,「語音數字信號處理」, 電子工業出版社. 1995[4]崔天宇 吉林大學碩士學位論文《基於HMM的語音識別系統的研究與實現 》[5]陸昱方,科技傳播第二期期刊《簡述語音識別的實現過程》
最近在學習語音識別相關知識,這篇文章做語音識別的入門介紹。