百度語音API的Python語音識別實踐

時間 2019-12-04

原文原文鏈接

百度語音對上傳的語音要求目前必須是單聲道，16K採樣率，採樣深度能夠是16位或者8位的PCM編碼。其餘編碼輸出的語音識別不出來。python 語音的處理技巧： oop 錄製爲MP3的語音（一般採樣率爲44100），要分兩步才能正確處理。第一步：使用諸如GoldWave的軟件，先保存爲16K採樣率的MP3；第二步，打開16K採樣率的MP3，另存爲Wav格式，參數選擇PCM，單聲道便可。編碼另外，也