貪心學院從BERT到XLNET

張俊林的詳細解釋 在b站看貪心學院最後一節課從BERT到XLNET的分享 上面PPT可以看到 1.XLNET是Autoregressive模型而BERT是Auto-encoding模型,兩種模型的對比解釋見https://blog.csdn.net/qq_33876194/article/details/98943383 2.XLNET不同於BERT中的self Attention而使用Two-s
相關文章
相關標籤/搜索