微軟最新AI算法通過照片和音頻產生逼真頭像演講視頻

越來越多的研究表明,只要語料庫足夠大,幾乎任何人的面部動作都可以與語音片段同步。今年6月,三星的應用科學家詳細介紹了一種端到端的模型,該模型可以在一個人的頭像中動畫化眉毛、嘴巴、睫毛和臉頰。幾周後,Udacity展示了一個系統,該系統可以從音頻敘述中自動生成一個站立的語音視頻。兩年前,卡內基梅隆大學(carnegie mellon university)的研究人員發表了一篇論文,描述了一種將面部動
相關文章
相關標籤/搜索