redis是一個key-value存儲系統。和Memcached相似,它支持存儲的value類型相對更多,包括string(字符串)、list(鏈表)、set(集合)、zset(sorted set --有序集合)和hash(哈希類型)。html
redis會週期性的把更新的數據寫入磁盤或者把修改操做寫入追加的記錄文件,而且在此基礎上實現了master-slave(主從)同步。git
https://github.com/rmax/scrapy-redisgithub
Scrapy_redis在scrapy的基礎上實現了更多,更強大的功能,具體體如今:reqeust去重,爬蟲持久化,和輕鬆實現分佈式。redis
中文文檔 http://www.redis.cn/commands.htmldom
git clone https://github.com/rolando/scrapy-redis.gitscrapy
執行domz的爬蟲,會發現redis中多了一下三個鍵:分佈式
變化結果:ide
dmoz:requests 有變化(變多或者變少或者不變)學習
dmoz:dupefilter 變多3d
dmoz:items 不變
變化結果分析:
redispipeline中僅僅實現了item數據存儲到redis的過程,咱們能夠新建一個pipeline(或者修改默認的ExamplePipeline),讓數據存儲到任意地方