字體反爬處理——Python

在爬取網站抓取數據的過程中,有時會遇到這樣一種情況:網頁瀏覽正常,開發者模式(F12)查看原來沒之後發現關鍵數據亂碼,當然爬取下來的結果也是亂碼。這種反爬策略一般稱之爲字體反爬。 以58同城爲例: 用瀏覽器隨便打開58同城的一個頁面,F12調出開發者調試窗口: 網頁顯示正常,調試窗口出現的內容與頁面顯示不符。 回到網頁上,右鍵查看網頁源代碼,搜索base64關鍵字,可以看到一大串用base64加密
相關文章
相關標籤/搜索