關於xlnet的一些理解

看張俊林老師的深度學習枕邊書時,一直有個疑問,Bert既然那麼好, 除了transformer提取特徵,使用的是雙向的語言模型, 那跟單向的GPT比,肯定更好呀,爲什麼還會有人用GPT呢? 知道答案後,害,真是外行問題: Bert屬於AE陣營,適用於語義理解等場景; GPT屬於AR陣營,適用於生成文本。 兩大陣營之間,發展出來了xlnet. xlnet常搜到的一句話就是: 最大化所有可能的序列的因
相關文章
相關標籤/搜索