[python] 使用Jieba工具中文分詞及文本聚類概念

        前面講述了很多關於Python爬取本體Ontology、消息盒InfoBox、虎撲圖片等例子,同時講述了VSM向量空間模型的應用。但是由於InfoBox沒有前後文和語義概念,所以效果不是很好,這篇文章主要是爬取百度5A景區摘要信息,再利用Jieba分詞工具進行中文分詞,最後提出文本聚類算法的一些概念知識。         相關文章:         [Python爬蟲] Selen
相關文章
相關標籤/搜索