全國建築市場監管公共服務平臺(四庫一)平臺數據爬取

jzsc.mohurd.gov.cn/data/compan…擊企業查詢, 發現返回的數據是通過加密的web

1. 尋找返回的數據

既然數據是經過這個 url 返回的, 全局搜索urlapi

jzsc.mohurd.gov.cn/api/webApi/…函數

嘗試全局模糊搜索 /query/comp/list測試

點擊進入 js 函數加密

返回的結果是請求 url /dataservice/query/comp/list獲得的, 打上斷點 點擊搜索 一步一步調式js代碼url

調試過程就不一步一步分析了, 最終定位到, 感受像咱們想要的數據, 進入Console打印一下te3d

t調試

t 中data 是 最初咱們請求http://jzsc.mohurd.gov.cn/api/webApi/dataservice/query/comp/list?pg=0&pgsz=15 所返回的數據code

e 這其中的數據不正是咱們想要的數據cdn

2.分析加密方式

既然咱們已經知道了數據的加密方式, 那咱們就重點分析一下這個地方

其中t.data咱們在第一步已經分出來了 使咱們第一步請求 http://jzsc.mohurd.gov.cn/api/webApi/dataservice/query/comp/list?pg=0&pgsz=15獲得的結果

那咱們重點分析 p函數 的處理過程, 點擊進入 p函數, 結果以下

對數據通過層層加密處理後,調用toString方法, 既然加密函數已經找到,咱們就能夠編寫代碼了

3.代碼實現

咱們將函數 p 的代碼複製出來, data是加密後返回的數據,咱們先複製出來用一下

運行一下項目

報錯的緣由 , 其中 ud 沒有進行初始化 咱們尋找一下 u 和 d , 就在函數 p的上方

咱們添加到代碼把 u 和 d 添加到代碼中

運行項目 進行測試

其中返回的數據 , 正是咱們想要的結果

請勿用於非法用途

相關文章
相關標籤/搜索