《精通Python網絡爬蟲:核心技術、框架與項目實戰》——導讀

前  言 爲何寫這本書正則表達式 網絡爬蟲其實很早就出現了,最開始網絡爬蟲主要應用在各類搜索引擎中。在搜索引擎中,主要使用通用網絡爬蟲對網頁進行爬取及存儲。算法 隨着大數據時代的到來,咱們常常須要在海量數據的互聯網環境中搜集一些特定的數據並對其進行分析,咱們可使用網絡爬蟲對這些特定的數據進行爬取,並對一些無關的數據進行過濾,將目標數據篩選出來。對特定的數據進行爬取的爬蟲,咱們將其稱爲聚焦網絡爬蟲。
相關文章
相關標籤/搜索