爬蟲 解析 加密字體 例子58 同城

一些網站 會將部分內容進行加密,防止爬蟲簡單的獲取到信息 最近 在爬取58同城的品牌公寓時 遇到租房信息裏的價格 爬下來是看不懂的字體 一些數據在瀏覽器裏面顯示是正常的, 但是渲染前和渲染後的html源碼都看不到字體, 渲染前看到的是16進制的4位字符, 渲染後看到的是一些方塊. 然後分析了一下網站的源碼,發現他是由base64 加密之後生成的字體 那我們就可以通過正則匹配出來進行處理 首先在ht
相關文章
相關標籤/搜索