Python爬蟲從入門到放棄（二十）之 Scrapy分佈式原理

時間 2021-07-12

原文原文鏈接

關於Scrapy工作流程回顧 Scrapy單機架構上圖的架構其實就是一種單機架構，只在本機維護一個爬取隊列，Scheduler進行調度，而要實現多態服務器共同爬取數據關鍵就是共享爬取隊列。分佈式架構我將上圖進行再次更改這裏重要的就是我的隊列通過什麼維護？這裏一般我們通過Redis爲維護，Redis，非關係型數據庫，Key-Value形式存儲，結構靈活。並且redis是內存中的數據結構存

>>阅读原文<<