爬蟲小記:利用cookies跳過登錄驗證碼

前言 在爬取某些網頁時,登錄界面時常常遇到的一個坎,而如今大多數的網站在登錄時都會要求用戶填寫驗證碼。固然,咱們能夠設計一套機器學習的算法去破解驗證碼,然而,驗證碼的形式多種多樣,稍微變一下(有些甚至是手機短信驗證),整套算法可能就徹底無效了,因此去強行破解驗證碼是一個吃力不討好的活。本文會以知乎網站爲例,利用python中的request模塊進行的一個模擬登錄,其中用到了reqeust.sess
相關文章
相關標籤/搜索