Python之爬蟲（二十四）爬蟲與反爬蟲大戰

時間 2019-12-11

原文原文鏈接

爬蟲與發爬蟲的廝殺，一方爲了拿到數據，一方爲了防止爬蟲拿到數據，誰是最後的贏家？服務器

從新理解爬蟲中的一些概念

爬蟲:自動獲取網站數據的程序
反爬蟲：使用技術手段防止爬蟲程序爬取數據
誤傷：反爬蟲技術將普通用戶識別爲爬蟲，這種狀況多出如今封ip中，例如學校網絡、小區網絡再或者網絡網絡都是共享一個公共ip，這個時候若是是封ip就會致使不少正常訪問的用戶也沒法獲取到數據。因此相對來講封ip的策略不是特別好，一般都是禁止某ip一段時間訪問。
成本：反爬蟲也是須要人力和機器成本
攔截：成功攔截爬蟲，通常攔截率越高，誤傷率也就越高網絡