兩種爬蟲模式比較:css
一、requests和beautifulsoup都是庫,scrapy是框架。web
二、scrapy框架中能夠加入requests和beautifulsoup。api
三、scrapy基於twisted,性能是最大的優點。框架
四、scrapy方便擴展,提供了不少內置的功能。機器學習
五、scrapy內置的css和xpath selector很是方便,beautifulsoup最大的缺點就是慢。scrapy
爬蟲能作什麼?性能
一、搜索引擎---百度、谷歌、垂直搜索引擎。學習
二、推薦引擎---今日頭條搜索引擎
三、機器學習數據樣本rest
五、數據分析(如金融數據分析)、輿情分析等。
網頁分類:
常見類型的服務:
一、靜態網頁
二、動態網頁
三、webservice(restapi)