TensorFlow實現語音識別

時間 2021-01-04

原文原文鏈接

整體介紹：環境python3.6+TensorFlow1.12 顯卡是英偉達GTX1070(後頭換個好些的顯卡)訓練了四天四夜主要技術點CTC，BRNN，MFCC特徵，全連接神經網絡 CTC時序分類算法：適合這種不知道輸入輸出是否對齊的情況(哪個字對應哪段聲音)使用的算法，所以CTC適合語音識別和手寫字符識別的任務，而傳統的語音識別是基於語音學的方法，通常包含拼寫、聲學和語音模型等單獨組件

>>阅读原文<<