谷歌爬蟲神器(Pyppeteer)--神擋殺神,佛擋殺佛

你遇到的問題 咱們可能用requests保存的網頁,返回到的都是JS代碼,那我怎麼解析網頁,Xpath和BS4都是篩選HTML標籤的呀。這咋辦?這說明人家是JS預加載,那些網站這樣作是爲了反爬蟲 若是是以前咱們肯能要分析JS代碼找到裏面的JSON數據,轉換JSON格式化,而後再抓數據 但是如今谷歌推出一款神器,神擋殺神,佛當殺佛 不管對方怎麼JS加載,用這個神器老是會返回HTML代碼 而後呢?你就
相關文章
相關標籤/搜索