Scrapy+Seleium+headless無頭瀏覽器爬取天眼查數據

時間 2021-01-20

原文原文鏈接

#難點： 1.數據接口很難找到，反爬措施很強，所以用的seleium模擬抓取 2.頁面數據字體進行了異常，需要進行反向破解 ###本文用的是天眼查移動端 m.tianyancha.com 進行抓取，輸入公司名可以抓取前面5條具體信息展示 ###還有網站字體異常反爬每天都會更新，所以需要後面使用的需要排除去除，用fontcreator軟件 ###代碼抓取也有些注意點，用的google無頭headle

>>阅读原文<<