論文筆記:On the Strength of Character Language Models for Multilingual Named Entity Recognition

簡介 本文提出了一種簡單的、語料庫無關的Character-level Language Model(CLM)。該方法不需要上下文信息即可判斷token是否是entity。作者進一步將該方法用於一些經典的NER系統中以提高其識別效果。 Methods 在CLM中,每一個token都被看成一個句子,每個字母看做一個詞,比如「Obama」會被看做句子「O b a m a」,以此訓練語言模型。 本文方法
相關文章
相關標籤/搜索