大部分爬蟲框架都是python
定個宏偉目標mysql
python基礎正則表達式
知識儲備redis
輔助工具sql
各類模塊 mongodb
反爬蟲策略數據庫
數據庫編程
數據分析json
進階技術網絡
Scrapy + MongoDB + Redis 分佈式爬蟲系統
a). Redis 用來存儲要爬取的網頁隊列,也就是任務隊列
b). MongoDB 用來存儲爬取的內容結果。
c) . Scrapy 裏放爬蟲crawler , 分別爬取不一樣的網頁內容。
學以至用