[DeeplearningAI筆記]序列模型3.9-3.10語音辨識/CTC損失函數/觸發字檢測

5.3序列模型與注意力機制 覺得有用的話,歡迎一起討論相互學習~Follow Me 3.9語音辨識 Speech recognition 問題描述 對於音頻片段(audio clip)x ,y生成文本(transcript),人聽見的或者麥克風捕捉的都是空氣中細微的氣壓變化,語音識別系統能夠根據這種微弱的氣壓變化將音頻轉化爲文本字符。 將空氣中微弱的氣壓變化顯示成頻率圖的形式,並輸出音頻的文本內容
相關文章
相關標籤/搜索