語音識別數據加強方法（google2019年7月論文）

時間 2020-08-04

標籤語音識別數據加強方法 google2019 google 7月論文欄目 Google 简体版

原文原文鏈接

論文：https://arxiv.org/pdf/1904.08779.pdfweb 要點：咱們構建了一個直接做用於對數梅爾頻譜圖的加強策略，以幫助網絡學習有用的功能。出於如下目的的動機：這些功能應對時間方向的變形，頻率信息的部分丟失以及小部分語音片斷具備較強的魯棒性，所以，咱們選擇瞭如下變形來制定策略： 1.使用tensorflow的sparse_image_warp函數進行時間扭曲。給定具

>>阅读原文<<