爬蟲開發知識入門基礎(3)

爬蟲的反爬 反爬這部分是個重點,爬蟲現在已經越來越難了,非常多的網站已經添加了各種反爬措施,在這裏可以分爲非瀏覽器檢測、封 IP、驗證碼、封賬號、字體反爬等。 下面主要從封 IP、驗證碼、封賬號三個方面來闡述反爬的處理手段。 反爬 / 封 IP 對於封 IP 的情況,可以分爲幾種情況來處理: • 首先尋找手機站點、App 站點,如果存在此類站點,反爬會相對較弱。 • 使用代理,如抓取免費代理、購買
相關文章
相關標籤/搜索