百度語音API的Python語音識別實踐

百度語音對上傳的語音要求目前必須是單聲道,16K採樣率,採樣深度能夠是16位或者8位的PCM編碼。其餘編碼輸出的語音識別不出來。python 語音的處理技巧: oop 錄製爲MP3的語音(一般採樣率爲44100),要分兩步才能正確處理。第一步:使用諸如GoldWave的軟件,先保存爲16K採樣率的MP3;第二步,打開16K採樣率的MP3,另存爲Wav格式,參數選擇PCM,單聲道便可。編碼 另外,也
相關文章
相關標籤/搜索