python3.6-製作一個含有NLP基本功能系統(Windows exe)自然語言處理系統

  系統功能:   分詞、詞性標註、關鍵詞提取、文本分類;   系統實現:   分詞:使用jieba中文分詞(去停用詞,精確模式);   詞性標註:使用jieba庫裏的posseg包進行詞性標註;   關鍵詞提取:使用tfidf的最合適前六個詞;   文本分類:給復旦預料數據進行分詞,生成詞向量,裝袋(詞袋模型),接着訓練集訓練,多次調參,具體參數註釋和代碼中有,然後再選擇相應測試預料進行測試,用
相關文章
相關標籤/搜索