無監督學習︱GAN 在 NLP 中遇到瓶頸+稀疏編碼自學習+對偶學習

深度學習訓練一個模型須要不少的人工標註的數據。例如在圖象識別裏面,常常咱們可能須要上百萬的人工標註的數據,在語音識別裏面,咱們可能須要成千上萬小時的人工標註的數據,機器翻譯更是須要數千萬的雙語句對作訓練。 看看標註數據的代價有多高。好比說對機器翻譯而言,如今若是咱們請人工來翻譯,一個單詞的費用差很少是5—10美分之間,一個句子平均長度差很少是30個單詞,若是咱們須要標註一千萬個雙語句對,也就是咱們
相關文章
相關標籤/搜索