GPU訓練的快速大規模分佈式擴展-GPU多機多卡Machine Learning Middleware

在其他同學的文章中已經介紹過了,阿里新的自動語音識別系統的第一個落地點,被選定在客服電話語音識別上。 這個落地項目非常難,首先就在於我們面對的語音數據非常多樣化:比如各種隨意的對話、不完整的句子、各種話題以及各種傳輸差異和環境噪聲。面對如此複雜的語音數據,我們後端的語音識別聲學模型就一定要儘可能的覆蓋各種可能的場景,包括各種對話、各種聲道、各種噪音甚至各種口音,而要覆蓋這些場景,就要求我們用海量的
相關文章
相關標籤/搜索