Python3——文章標題關鍵字提取

思路:1.讀取全部文章標題;2.用「結巴分詞」的工具包進行文章標題的詞語分割;3.用「sklearn」的工具包計算Tf-idf(詞頻-逆文檔率);4.獲得知足關鍵詞權重閾值的詞html 結巴分詞詳見:結巴分詞Githubpython sklearn詳見:文本特徵提取——4.2.3.4 Tf-idf項加權git import os import jieba import sys from sklea
相關文章
相關標籤/搜索