《Python 數據分析與挖掘實戰》第十五章 電商產品評論數據LDA主題模型、文本挖掘

一、分析方法與過程 本次針對京東商城上的「美的」熱水器的文本評論數據進行建模分析。本文進行基本的預處理、分詞等操作後建立LDA主題模型,實現對文本評論數據的傾向性判斷及信息挖掘分析。 (1)利用爬蟲進行數據採集(由於最近較忙,爬蟲代碼等空了再附上,暫且先用書中提供的數據進行建模),原始文本評論數據爲 將品牌爲「美的」的一列評論抽取,另存爲文本文件。代碼如下 (2)對數據進行基本處理,包括數據預處理
相關文章
相關標籤/搜索