【計算機科學】【2019.02】自然語言處理中的神經遷移學習

本文爲愛爾蘭國立大學(作者:Sebastian Ruder)的博士論文,共329頁。 當前基於神經網絡的自然語言處理模型擅長從大量標註數據中學習。鑑於這些能力,自然語言處理越來越多地應用於新任務、新領域和新語言。然而,目前的模型對噪音和對抗性的例子很敏感,並且容易過度擬合。這種脆弱性,加上注意力的消耗,挑戰了有監督學習的範式。 遷移學習使我們能夠利用從相關數據中獲得的知識來提高目標任務的績效,以預
相關文章
相關標籤/搜索