爬蟲（一）：爬蟲原理與數據抓取

時間 2020-01-29

原文原文鏈接

1.通用爬蟲和聚焦爬蟲根據使用場景，網絡爬蟲可分爲通用爬蟲和聚焦爬蟲兩種.html 通用爬蟲通用網絡爬蟲是捜索引擎抓取系統（Baidu、Google、Yahoo等）的重要組成部分。主要目的是將互聯網上的網頁下載到本地，造成一個互聯網內容的鏡像備份python 聚焦爬蟲聚焦爬蟲，是"面向特定主題需求"的一種網絡爬蟲程序，它與通用搜索引擎爬蟲的區別在於：聚焦爬蟲在實施網頁抓取時會對

>>阅读原文<<