博客訪問量v2.0 - 「假裝者」版爬蟲

(聲明一下:刷閱讀數可恥。) 上一篇文章介紹了博客爬取的思路,本文將介紹假裝的思路,嘗試讓爬蟲模擬正常人爲的操做。css 思路 IP代理:正常狀況下,大多數的請求應來自不一樣IP,所以進行IP代理是十分必要的(因爲沒有合適的工具,所以本文不涉及IP代理); 請求頭假裝:每一個瀏覽器發出的請求頭信息各不相同,特別是「Accept」、「Accept-Encoding」、「Accept-Language
相關文章
相關標籤/搜索