NLP預訓練模型綜述

       現在深度學習越來越火了,在NLP領域主要使用CNNs、RNNs、GNNs以及attention機制。儘管這些模型取得了一些成績,但是和CV相比,還是有些差距的,主要原因是大部分NLP任務的監督學習數據很少,而深度學習模型的參數有很多,需要大量的數據纔可以學習好,否則就會發生過擬合現象,這就導致NLP模型一般都是1-3層的淺層神經網絡。        近幾年,預訓練模型的出現在NLP領
相關文章
相關標籤/搜索