Scrapy+Seleium+headless無頭瀏覽器爬取天眼查數據

#難點: 1.數據接口很難找到,反爬措施很強,所以用的seleium模擬抓取 2.頁面數據字體進行了異常,需要進行反向破解 ###本文用的是天眼查移動端 m.tianyancha.com 進行抓取,輸入公司名可以抓取前面5條具體信息展示 ###還有網站字體異常反爬每天都會更新,所以需要後面使用的需要排除去除,用fontcreator軟件 ###代碼抓取也有些注意點,用的google無頭headle
相關文章
相關標籤/搜索