Python爬蟲：反爬措施及應對措施-selenium+phantomjs

時間 2020-08-09

標籤 python 爬蟲措施應對 selenium+phantomjs selenium phantomjs 欄目 Python 简体版

原文原文鏈接

反爬策略 1. 判斷user-agent客戶端標識來判斷是否爲爬蟲css 解決辦法：封裝 user-agent 到請求頭 2. 經過訪問頻率來判斷解決辦法：html 設置等待時長，爬取時間間隔，能夠使用強制等待。在用戶高峯期爬取，衝散日誌 3. 封 IPweb 解決辦法：使用代理池 4. 頁面的內容沒法直接獲取，都是js 代碼ajax 解決辦法：selenium + phantomjs 的組合

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。