基於selenium和requests的京東商品信息和評論爬蟲

寫了個京東爬蟲,基於selenium和requests兩個包相結合的,能抓取產品的標題、價格、評論數量、產品的url、產品前100條評論(需要抓取更多可以在代碼裏面改動)、產品的規格、產品介紹、產品售後信息。數據結合peewee存入sqlite數據庫。先執行JD_model.py建立數據庫,然後主程序入口JDcrawler.py。現檢索詞爲「電纜線」。 代碼github
相關文章
相關標籤/搜索