ElECTRA:震驚NLPER居然可以使用GAN了![PART2]

本文同步發佈與知乎:ElECTRA:NLPER也可以使用GAN了?[Part-2],知乎主頁lynne阿黎請大家不吝關注~ 18年Bert橫空出世,刷新了各大榜單之後,對齊的改進層出不窮,Ernie, Albert大多數改進都沒有新意,無非就是大力出奇跡的堆疊參數。ICLR2020 斯坦福和Google爲我們提供了一種新思路,用Bert來"欺騙"Bert,模型改進了MLM(Masked Langu
相關文章
相關標籤/搜索