基於分佈式的短文本命題實體識別之----人名識別(python實現)

目前對中文分詞精度影響最大的主要是兩方面:未登錄詞的識別和歧義切分。 據統計:未登錄詞中中文姓人名在文本中一般只佔2%左右,但這其中高達50%以上的人名會產生切分錯誤。在所有的分詞錯誤中,與人名有關的錯誤佔到了將近90%,這中國人名都是根據人的想法起的名字,有很大的隨意性,並且數量巨大,規律也不盡相同。 1.理論簡介 命名實體識別(Named Entities Recognition, NER)是
相關文章
相關標籤/搜索