Python爬蟲學習筆記2

urllib 基礎 1)爬取到內存中 注:ignore可以規避解碼細節問題防止報錯。 2)爬取到本地 3)瀏覽器僞裝 利用瀏覽器標識來僞裝成瀏覽器來突破反爬 4)用戶代理池 用多個瀏覽器標識進行僞裝 若想設置每爬N次換一次代理: 例如每爬五次 2.如何批量爬取(並翻頁)
相關文章
相關標籤/搜索