語音識別數據加強方法(google2019年7月論文)

論文:https://arxiv.org/pdf/1904.08779.pdfweb 要點: 咱們構建了一個直接做用於對數梅爾頻譜圖的加強策略,以幫助網絡學習有用的功能。 出於如下目的的動機:這些功能應對時間方向的變形,頻率信息的部分丟失以及小部分語音片斷具備較強的魯棒性,所以,咱們選擇瞭如下變形來制定策略: 1.使用tensorflow的sparse_image_warp函數進行時間扭曲。給定具
相關文章
相關標籤/搜索