Python實現視頻語音和字幕自動審查功能

時間 2021-01-20

原文原文鏈接

功能描述：提取視頻文件中的圖像然後使用OCR技術識別靜態圖像中的文本，提取視頻文件中的音頻然後使用語音識別技術提取其中的文本，如果視頻文本或音頻文本中包含指定的關鍵詞則進行提示。代碼使用tesseract進行OCR識別視頻圖像中的文本，然後以百度語音識別爲例進行演示，但事實證明百度語音識別效果非常不好，可以進行大規模訓練試試能不能提高識別率，或者使用其他識別率更高的平臺API。實現步驟： 1