文本挖掘:手把手教你分析攜程網評論數據

文本分析的應用愈來愈普遍,這不,個人工做也開始涉及了文本分析,今天就講講關於評論數據的那點事。正則表達式 首先評論數據如何獲取?網絡 通常經過網絡爬蟲的方式抓取各大網站的評論數據,本次分析數據就來源於攜程網某酒店的評論,在同事的協助下,成功爬取該酒店的評論數據,因而我開始使用這些數據作相關的分析。app 本次文本分析中須要使用以下3個包:dom 1)Rwordseg包用於分詞函數 2)tmcn用於
相關文章
相關標籤/搜索