python借用百度語音識別實現大音頻文件語音識別功能

時間 2019-12-04

原文原文鏈接

實現思路：先用ffmpeg將其餘非wav格式的音頻轉換爲wav格式，並轉換音頻的聲道（百度支持聲道爲1），採樣率（值爲8000），格式轉換完成後，再用ffmpeg將音頻切成百度支持的時長（30秒和60秒2種，本程序用的是30秒）。 # coding: utf-8 import json import time import base64 from inc import rtysdb impor

>>阅读原文<<