爬蟲技術之規避驗證碼

各地工商網站(全稱國家企業信用信息公示系統)因爲包含大量企業真實信息,金融貸款徵信等都用得到,天然吸引了很大部分來自爬蟲的火力,因此反爬蟲措施格外嚴格。一般的網站僅在登錄註冊等環節,或者訪問頻繁後才彈出驗證碼,而工商網站查詢無需登錄,每查一次關鍵字就需要一次驗證碼。同時各地工商網站由於各自獨立開發,自主採用了各種不同的驗證碼機制,更是給全量爬取的爬蟲增加了更多的障礙。因此,工商網站的驗證碼特別具有
相關文章
相關標籤/搜索