【cs224n-16】Low Resource Machine Translation

         神經機器翻譯(NMT)的成功往往依賴於大量高質量的雙語語料作爲訓練數據。如果是蒙古語、尼泊爾語這些小語種,無法提供足夠多的雙語數據,更極端的現實情況是,有些語言幾乎沒有任何雙語預料,這種情況下NMT就無能爲力了。     鬆散定義:當並行句子數量在10,000或更少時,可以認爲語言對資源不足。注:現代NMT系統現在有數億個參數!     挑戰:              數據: 
相關文章
相關標籤/搜索