微軟最新AI算法通過照片和音頻產生逼真頭像演講視頻

時間 2021-01-16

原文原文鏈接

越來越多的研究表明，只要語料庫足夠大，幾乎任何人的面部動作都可以與語音片段同步。今年6月，三星的應用科學家詳細介紹了一種端到端的模型，該模型可以在一個人的頭像中動畫化眉毛、嘴巴、睫毛和臉頰。幾周後，Udacity展示了一個系統，該系統可以從音頻敘述中自動生成一個站立的語音視頻。兩年前，卡內基梅隆大學（carnegie mellon university）的研究人員發表了一篇論文，描述了一種將面部動

>>阅读原文<<