(一)NLP基礎知識

1、NLTK 一種流行的自然語言處理庫、自帶語料庫、具有分類,分詞等很多功能,國外使用者居多,類似中文的jieba處理庫 2、文本處理流程 3、分詞 英文用NLTK,中文用jieba等,比較難處理時候,可能得藉助正則表達式。 4、複雜的詞形 處理數據的時候可能需要變化詞形,分2中情況: 1)Inflection變化:不影響詞性 walk ⇒ ⇒ walking ⇒ ⇒ walked 2) deri
相關文章
相關標籤/搜索