數據挖掘學習(三)——文本挖掘

對情感進行分析,對評論數據進行相應的分析。 可以用結巴進行分詞,主要是劃分各文本之間的關係,進行分詞操作。 Dict.txt是指結巴使用的分詞,也可以自己定義相應的結巴詞典,也可以下載一些好用的詞典。 第一個參數:我們的詞彙; 第二個參數:詞頻(即重要的程度); 第三個參數:詞性 1)使用jieba進行分詞: #!/usr/bin/env python # _*_ UTF-8 _*_ import
相關文章
相關標籤/搜索