切分也重要:基於多粒度語言單元切分的BERT模型

論文標題: AMBERT: A PRE-TRAINED LANGUAGE MODEL WITH MULTI-GRAINED TOKENIZATION 論文作者: Xinsong Zhang, Hang Li 論文鏈接: https://arxiv.org/pdf/2008.11869.pdf 不同粒度語言單元的切分 在深度學習時代,將語言單元切分爲怎樣的粒度是一個很重要的問題,它首先影響了詞典的大
相關文章
相關標籤/搜索