scrapy爬蟲教程(二)--第一個爬蟲

上篇文章大致瞭解scrapy的流程,生成了lagou.py爬蟲文件,接着看看爬蟲文件的內容: 通過上圖看出爬蟲是繼承自scrapy.Spider,在進入到Spider中找到入口函數start_requests 爬蟲就是通過這裏作爲入口創建request對象,通過引擎發送給調度器,下載器獲取到request進行下載,生成response發送給爬蟲的parse函數進行解析 父類scrapy.Spide
相關文章
相關標籤/搜索