scrapy vs requests+beautifulsoup

 

兩種爬蟲模式比較:css

一、requests和beautifulsoup都是庫,scrapy是框架。web

二、scrapy框架中能夠加入requests和beautifulsoup。api

三、scrapy基於twisted,性能是最大的優點。框架

四、scrapy方便擴展,提供了不少內置的功能。機器學習

五、scrapy內置的css和xpath selector很是方便,beautifulsoup最大的缺點就是慢。scrapy

 

爬蟲能作什麼?性能

一、搜索引擎---百度、谷歌、垂直搜索引擎。學習

二、推薦引擎---今日頭條搜索引擎

三、機器學習數據樣本rest

五、數據分析(如金融數據分析)、輿情分析等。

 

網頁分類:

常見類型的服務:

一、靜態網頁

二、動態網頁

三、webservice(restapi)

相關文章
相關標籤/搜索