Hierarchical Generative Modeling for Controllable Speech Synthesis筆記

文章目錄 可控語音合成的分層生成建模 一、簡介 二、模型 2.1 具有分層隱式變量的可控生成模型 2.2 變分推論和訓練 2.3 顯示分類標籤的連續屬性空間 2.4 神經網絡結構 三、相關研究 四、實驗 可控語音合成的分層生成建模 本文提出了一種神經端到端文本到語音(TTS)模型,該模型可以控制生成的語音中潛在的屬性,這些屬性很少在訓練數據中註釋,例如說話風格,重音,背景噪聲和記錄條件。該模型被公
相關文章
相關標籤/搜索