python使用代理處理反爬抓取微信文章

時間 2021-01-11

原文原文鏈接

1.分析網頁確定思路我們這次準備爬取搜狗的微信搜索頁面的結果，以風景爲例：可以看到這和我們之前爬取過的案例幾乎類似，沒什麼新意，但是這裏有一個比較神奇的地方就是10頁以後的內容需要掃碼登錄微信才能查看另外，在請求次數過多的時候還會出現封禁 ip 的情況，對應我們頁面的狀態碼就是出現 302 跳轉思路梳理： (1)requests 請求目標站點，得到索引頁的源碼，返回結果 (2)如果遇到

>>阅读原文<<