LM在speech recognition中的應用

今天我們來看看language model(簡稱LM)在speech recognition中的應用。 首先來看上圖,LM主要可以預測token sequence 的機率,雖然我們的LAS中其實只需要P(Y|X)的數值即可,但在實際操作中我們還是會加上P(Y)的數值,我們知道P(Y|X)需要的都是成對的數據,但是P(Y)非常容易去收集。 我們可以看看,Google的語音訓練模型一共使用了12500
相關文章
相關標籤/搜索