打造一個輕量級企業基本信息採集框架（一）

時間 2021-01-02

原文原文鏈接

前言好久沒有系統性的寫一篇博文了。爬蟲工作也進行了快兩年了，從簡單的requests、xpath解析到js逆向、app反編譯、驗證碼識別等多多少少都經歷一些。一個爬蟲項目可能由上面一個或者多組成。今天這個spider用scrapy寫，明天那個spider用multiprocessing，後天那個爬蟲用threading寫等等。我們都在儘量的把自己所學應用在各種各樣的爬蟲當中。這些可能都是一些小項

>>阅读原文<<