語音識別技術

簡要給大家介紹一下語音怎麼變文字的吧。 首先說一下作爲輸入的時域波形。我們知道聲音實際上是一種波。常見的mp3、wmv等格式都是壓縮格式,必須轉成非壓縮的純波形文件,比如Windows PCM文件,即wav文件來處理。wav文件裏存儲的除了一個文件頭以外,就是聲音波形的一個個點了。採樣率越大,每毫秒語音中包含的點的個數就越多。另外聲音有單通道雙通道之分,還有四通道的等等。對語音識別任務來說,單通道
相關文章
相關標籤/搜索