機器學習-nlp-sklearn進行關鍵詞提取（基於tfidf）

時間 2021-01-02

標籤機器學習 # nlp nlp 關鍵詞 sklearn tfidf 欄目網站開發简体版

原文原文鏈接

背景 tfidf相對詞頻可以很好的反應出文本中的關鍵詞。本文將使用sklearn進行關鍵詞提取。實戰結巴分詞使用pandas讀取csv文件內容遍歷titile內容進行分詞加載停用詞遍歷進行停詞使用sklearn的TfidfVectorizer對文本進行向量化 tfidf.toarray()轉換成爲矩陣，然後進行行排序，取最後的n個索引（argsort是拿到索引值）通過get_fea

>>阅读原文<<