Python Scrapy

安裝: pip install scrapy 安裝後:用scrapy -h來檢測安裝效果。 爬蟲框架結構! 5+2結構:5個主要模塊,兩個中間鍵。 SPI到ENG,獲取下一個要爬取的網絡請求。 就是一個URL。真實的。 然後,ENG將此請求轉發給SCHED模塊。負責對爬取請求調度。 ENG到DOWN,真實連接到互聯網,進行爬。 再反過來走一次!再發送給ENG。 最後,ENG又會轉發給SPI模塊!
相關文章
相關標籤/搜索