TensorFlow實現語音識別

整體介紹: 環境python3.6+TensorFlow1.12  顯卡是英偉達GTX1070(後頭換個好些的顯卡)訓練了四天四夜 主要技術點CTC,BRNN,MFCC特徵,全連接神經網絡 CTC時序分類算法: 適合這種不知道輸入輸出是否對齊的情況(哪個字對應哪段聲音)使用的算法,所以CTC適合語音識別和手寫字符識別的任務,而傳統的語音識別是基於語音學的方法,通常包含拼寫、聲學和語音模型等單獨組件
相關文章
相關標籤/搜索