NLP學習筆記(5)

傳統的語音識別模型需要建立一個generative模型,從語言模型中產生單詞序列,然後產生tokens(音標)序列,然後產生語音序列(時域或頻域的聲音序列),然後是計算得到一些特徵(信號處理專家給出計算方法),這樣當語音序列進來的時候,就會被換算成同樣的特徵,然後逆流而上搜索對應的Y 如果把上述的每一個元件都用神經網絡來實現,會發現神經網絡在每一個步驟都做得比傳統方法要更好 但我們希望能做到端到端
相關文章
相關標籤/搜索