實體知識+字典樹輔助jieba的分詞(並對三國演義進行簡單分析)

      在作中文NLP的時候,分詞可謂是基礎中的基礎。然而這個基礎部分的內容直到今天仍是讓人不省心,在實際應用中【尤爲是在人名等實體的識別上】老是顯得漏洞百出。下面以python上比較流行的一箇中文分詞庫jieba爲例,看看它的一次表現:python import jieba print(" ".join(jieba.cut("""玄德謝別二客,便命良匠打造雙股劍。 雲長造青龍偃月刀,又名「冷
相關文章
相關標籤/搜索