語音識別WFST-based dynamic decoders

目前語音識別主流是基於WFST解碼器,WFST中的優化操作如Determinization,Minimization,Weight Pushing 使得Viterbi解碼速度大大加快。 然而實際語音識別的問題還有很多,第一,往往基於靜態的HCLG.fst 可能非常大,需要消耗大量內存;第二,靜態的HCLG.fst 非常大,一旦語言模型G.fst或者 HMM模型H.fst, Context phon
相關文章
相關標籤/搜索