分佈式爬蟲原理

在瞭解分佈式爬蟲架構之前,看下crapy的架構,如下圖所示。 1、Scrapy 框架 Scrapy是用純Python實現一個爲了爬取網站數據、提取結構性數據而編寫的應用框架,用途非常廣泛。 框架的力量,用戶只需要定製開發幾個模塊就可以輕鬆的實現一個爬蟲,用來抓取網頁內容以及各種圖片,非常之方便。 Scrapy 使用了 Twisted’twɪstɪd異步網絡框架來處理網絡通訊,可以加快我們的下載速度
相關文章
相關標籤/搜索