端到端語音識別(一) 概況

傳統方法的侷限性[1] HMM Markovian Assumption p(qt|q<t)=p(qt|qt−1) 轉移機率只跟前一個時刻有關,沒法對長時依賴性建模。 Conditional Independence Assumption p(xt|x<t,q≤t)=p(xt|qt) 幀的生成機率只跟當前狀態有關,跟歷史狀態和歷史幀無關。 DNN alignment DNN的聲學模型用來求輸出狀態
相關文章
相關標籤/搜索