BERT論文精讀理解

Devlin J, Chang M W, Lee K, et al. Bert: Pre-training of deep bidirectional transformers for language understanding[J]. arXiv preprint arXiv:1810.04805, 2018. 該篇論文被評選爲2019 NAACL的最佳論文,由Google AI團隊在2018
相關文章
相關標籤/搜索