JavaShuo
欄目
標籤
Uncovering Latent Style Factors for Expressive Speech Synthesis
時間 2021-07-12
原文
原文鏈接
最近拜讀王宇軒的舊作,希望能順着作者的思路窺得一點語音合成研究的方向。 這篇文章應該是宇軒大佬剛進谷歌發表的,2017年。應該是tacotron發表之後,GST的想法雛形,因此文章只放在axriv上邊。 abstract 本文旨在控制語音合成的韻律,在tacotron的基礎上加"style token",從而不需要註釋的數據,可以直接通過data-driven的方式,學到各種韻律的變化。變長的句子
>>阅读原文<<
相關文章
1.
[ICCV2019] Unsupervised Robust Disentangling of Latent Characteristics for Image Synthesis
2.
Hierarchical Generative Modeling for Controllable Speech Synthesis筆記
3.
Tacotron: Towards End-to-End Speech Synthesis
4.
style-GAN:A Style-Based Generator Architecture for Generative Adversarial Networks. (一)
5.
[TMI2018-03]Multimodal MR Synthesis via Modality-Invariant Latent Representation
6.
HTML5 之音頻合成(Speech Synthesis)
7.
[Style Transfer]——Blood Vessel Geometry Synthesis using Generative Adversarial Networks
8.
【文獻解讀 情感合成】Expressive Speech Driven Talking Avatar Synthesis with DBLSTM using 有限的情感雙峯數據
9.
Voice Conversion by Cascading Automatic Speech Recognition and Text-to-Speech Synthesis with Prosody
10.
HTML5語音合成Speech Synthesis API簡介
更多相關文章...
•
ASP.NET Style 控件
-
ASP.NET 教程
•
ASP.NET Style 屬性
-
ASP.NET 教程
•
PHP開發工具
•
C# 中 foreach 遍歷的用法
相關標籤/搜索
speech
synthesis
expressive
uncovering
latent
factors
style
loader&style
4Large-Style
style&theme
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
部署Hadoop(3.3.0)僞分佈式集羣
2.
從0開始搭建hadoop僞分佈式集羣(三:Zookeeper)
3.
centos7 vmware 搭建集羣
4.
jsp的page指令
5.
Sql Server 2008R2 安裝教程
6.
python:模塊導入import問題總結
7.
Java控制修飾符,子類與父類,組合重載覆蓋等問題
8.
(實測)Discuz修改論壇最後發表的帖子的鏈接爲靜態地址
9.
java參數傳遞時,究竟傳遞的是什麼
10.
Linux---文件查看(4)
本站公眾號
歡迎關注本站公眾號,獲取更多信息
相關文章
1.
[ICCV2019] Unsupervised Robust Disentangling of Latent Characteristics for Image Synthesis
2.
Hierarchical Generative Modeling for Controllable Speech Synthesis筆記
3.
Tacotron: Towards End-to-End Speech Synthesis
4.
style-GAN:A Style-Based Generator Architecture for Generative Adversarial Networks. (一)
5.
[TMI2018-03]Multimodal MR Synthesis via Modality-Invariant Latent Representation
6.
HTML5 之音頻合成(Speech Synthesis)
7.
[Style Transfer]——Blood Vessel Geometry Synthesis using Generative Adversarial Networks
8.
【文獻解讀 情感合成】Expressive Speech Driven Talking Avatar Synthesis with DBLSTM using 有限的情感雙峯數據
9.
Voice Conversion by Cascading Automatic Speech Recognition and Text-to-Speech Synthesis with Prosody
10.
HTML5語音合成Speech Synthesis API簡介
>>更多相關文章<<