谷歌爬蟲神器（Pyppeteer）--神擋殺神，佛擋殺佛

時間 2020-07-20

原文原文鏈接

你遇到的問題咱們可能用requests保存的網頁，返回到的都是JS代碼，那我怎麼解析網頁，Xpath和BS4都是篩選HTML標籤的呀。這咋辦？這說明人家是JS預加載，那些網站這樣作是爲了反爬蟲若是是以前咱們肯能要分析JS代碼找到裏面的JSON數據，轉換JSON格式化，而後再抓數據但是如今谷歌推出一款神器，神擋殺神，佛當殺佛不管對方怎麼JS加載，用這個神器老是會返回HTML代碼而後呢？你就