教你訓練一個簡單的音頻識別網絡(附代碼)

來源:大數據文摘 本文長度爲7600字,建議閱讀10分鐘 本文將一步步向你展示,如何建立一個能識別10個不同詞語的基本語音識別網絡。 你需要知道,真正的語音與音頻識別系統要複雜的多,但就像圖像識別領域的MNIST,它將讓你對所涉及的技術有個基本瞭解。 完成本教程後,你將擁有一個模型,能夠辨別一個1秒鐘的音頻片段是否是無聲的、無法識別的詞語,或者是「yes」、「no」、「up」、「down」、「le
相關文章
相關標籤/搜索