python借用百度語音識別實現大音頻文件語音識別功能

實現思路:先用ffmpeg將其餘非wav格式的音頻轉換爲wav格式,並轉換音頻的聲道(百度支持聲道爲1),採樣率(值爲8000),格式轉換完成後,再用ffmpeg將音頻切成百度 支持的時長(30秒和60秒2種,本程序用的是30秒)。 # coding: utf-8 import json import time import base64 from inc import rtysdb impor
相關文章
相關標籤/搜索