文本處理方法概述

說明:本篇以實踐爲主,理論部分會盡量給出參考鏈接 摘要:   1.分詞   2.關鍵詞提取   3.主題模型(LDA/TWE)   4.詞的兩種表現形式(詞袋模型和分佈式詞向量)   5.關於文本的特徵工程   6.文本挖掘(文本分類,文本用戶畫像) 內容:   1.分詞   分詞是文本處理的第一步,詞是語言的最基本單元,在後面的文本挖掘中無論是詞袋錶示還是詞向量形式都是依賴於分詞的,所以一個好的
相關文章
相關標籤/搜索