Audio Split 基於雙門限法的語音端點檢測及語音分割
代碼在我的github上voice_activity_detection
如果您覺得有一點點用,請隔空比個心(或者,去我的github上點一下 「Star」 也可以~)
根據短時能量和過零率, 基於雙門限法的語音端點檢測及語音分割
直接運行audio_split.py,會對./raw_audio文件夾下的所有音頻文件進行分割:
以上各步驟可選,參數均可自由設置,程序裏有詳細註釋。
另外,對於acoustic_feature.py,請看我另一個倉庫:聲學特徵提取
關於./raw_audio文件夾下的兩個示例文件,運行程序會有兩張plot輸出:
圖1 漢語:「藍天 白雲」的語音端點檢測
圖2 一些漢語數字的語音端點檢測
關於本程序的依賴庫(其中Librosa最好和我使用的版本一致,其他版本都沒測試過):
如果你喜歡本程序,並且它對你有些許幫助,歡迎給我打賞一杯奶茶哈~
微信:
支付寶: