An Unsupervised Autoregressive Model for Speech Representation Learning

1. 論文摘要 出發點是爲下游任務保留儘可能多的信息,希望學到使用線性分類器就能在下游任務中表現較好的特徵,並且可以在多個不同任務中有較好的表現。 不需要音素級別或者字級別的邊界標籤。在模型的下面層的特徵表示主要捕捉說話人識別信息,較上層的特徵提供更多的音素信息。 文獻綜述部分觀點:(1)低contrstive loss 與低的線性分類器error 相關。 2. 模型介紹 通過一個自迴歸模型去預測
相關文章
相關標籤/搜索