爬蟲入門(一)爬蟲的基本知識

什麼時爬蟲? 網絡爬蟲(又被稱爲網頁蜘蛛,網絡機器人)就是模擬瀏覽器發送網絡請求,接收請求響應,一種按照必定的規則,自動地抓取互聯網信息的程序. 原則上來講,只要是瀏覽器(客戶端)能作的事情,爬蟲都可以作.*css 爬蟲的分類與流程 根據被爬網站的數量的不一樣,咱們把爬蟲分爲: 通用爬蟲 :一般指搜索引擎的爬蟲 聚焦爬蟲 :針對特定網站的爬蟲 爬蟲的流程 搜索引擎的侷限性 通用搜索引擎所返回的網頁
相關文章
相關標籤/搜索