(3) 使用sklearn包提取文章的關鍵詞

本篇一樣是使用TF-IDF算法提取關鍵詞,只不過是使用sklearn中封裝好的包進行提取。不一樣的是對原始語料庫格式的要求,sklearn要求語料庫中文章的分詞之間以空格分隔,如如下示例:算法 segment 第一篇文章 我 是 中國 人 。 第二篇文章 你 是 美國 人 。 第三篇文章 他 叫 什麼 名字? 第四篇文章 她 是 誰 啊? TF-IDF的實驗參考上一篇使用TF-IDF算法提
相關文章
相關標籤/搜索