語音識別算法原理文檔整理(九)

數據文件內容簡介 數據準備階段的輸出包含兩部分。一部分與―數據相關(保存在諸如data/train/之類的目錄下),另一部分則與語言相關(保存在諸如data/lang/之類的目錄下)。 數據部分與數據集的錄音相關,而―語言部分則與語言本身更相關的內容,例如發音字典、音素集合以及其他Kaldi需要的關於音素的額外信息。如果你想用已有的識別系統和語言模型對你的數據進行解碼,那麼你只需要重寫―數據部分。
相關文章
相關標籤/搜索