Python實現視頻語音和字幕自動審查功能

功能描述: 提取視頻文件中的圖像然後使用OCR技術識別靜態圖像中的文本,提取視頻文件中的音頻然後使用語音識別技術提取其中的文本,如果視頻文本或音頻文本中包含指定的關鍵詞則進行提示。 代碼使用tesseract進行OCR識別視頻圖像中的文本,然後以百度語音識別爲例進行演示,但事實證明百度語音識別效果非常不好,可以進行大規模訓練試試能不能提高識別率,或者使用其他識別率更高的平臺API。 實現步驟: 1
相關文章
相關標籤/搜索