Scrapy:Python的爬蟲框架

網絡爬蟲,是在網上進行數據抓取的程序,使用它能夠抓取特定網頁的 HTML 數據。雖然我們利用一些庫開發一個爬蟲程序,但是使用框架可以大大提高效率,縮短開發時間。Scrapy 是一個使用 Python 編寫的,輕量級的,簡單輕巧,並且使用起來非常的方便。 Scrapy 使用了 Twisted 異步網絡庫來處理網絡通訊。整體架構大致如下: Scrapy 主要包括了以下組件: 1、引擎:用來處理整個系統
相關文章
相關標籤/搜索