主要思路python
目的:cookie
根據輸入的城市名,爬取該城市美團美食板塊全部商家的數據。數據包括: ide
店名、評分、評論數量、均價、地址,工具
並將這些數據存入Excel中。開發工具
最後嘗試對爬取到的數據作一個簡單的分析。 spa
克服反爬蟲:code
爬取每頁數據後,隨機中止一段時間後再爬下一頁;blog
每頁使用不一樣的cookie值。ip
具體原理:unicode
詳細的實現過程見源代碼。
開發工具
Python版本:3.5.4
相關模塊:
requests模塊;
win_unicode_console模塊;
openpyxl模塊;
以及一些Python自帶的模塊。
環境搭建
安裝Python並添加到環境變量,pip安裝須要的相關模塊便可。
相關文件
關注公衆號「python工程獅」回覆「美團美食」獲取。
使用演示
在cmd窗口運行MT_Cate_Spider.py文件便可。
簡單分析
利用Excel的數據分析功能簡單分析
用的上海地區的數據。
首先固然是按照評分排個序,而後作成柱狀圖:
而後是評論數量排個序,作成柱狀圖:
而後再作點其餘有趣的圖案: