- Python 網絡爬蟲概述 [ 筆記 ]

目錄   概念 類型 網絡爬蟲的工作流程 概念 網絡爬蟲(又被稱爲網頁蜘蛛,網絡機器人),是一種按照一定的規則,自動地抓取萬維網信息的程序或者腳本。   類型 類型 描述 通用網絡爬蟲 傳統的搜索引擎,屬於通用網絡爬蟲的範圍,但是通用爬蟲具有一定的侷限性,因爲它所面向的數據龐大而且繁雜,沒有針對性,所以用通用爬蟲爬出來的數據會有很多用戶不關心的數據,且它對密集型的一些信息包括圖片、音頻、視頻等不能
相關文章
相關標籤/搜索