爬蟲教程2---Python爬蟲加代理「僞裝」

上面一篇說到爬蟲必須加上「隱身衣」(變換user-agent,proxyIP),「風火輪」(多線程加速)以及「復活藥水」(被封后自動重啓續爬)。 根據博主的經驗,不僞裝IP地址和useragent,開多線程完全是開玩笑,所以博主按照先加「隱身衣」,再加「復活藥水」,最後加「風火輪」的步驟構建爬蟲。 本篇介紹如何加「隱身衣」。 依然使用www.baidu.com。 想要爬取一個網站,首先要了解網站服
相關文章
相關標籤/搜索