噹噹網書籍數據爬進數據庫

時間 2021-01-05

原文原文鏈接

噹噹網書籍數據爬進數據庫首先我們要考慮到噹噹網有沒有反爬機制，幾次後發現是沒有的。一開始我們要考慮我們要爬取的信息是哪些，然後在items.py下面全部寫出來。然後就寫爬蟲文件從核心文件開始定位導入items裏面的類。（一定不要導入錯了）對應的爬取地址寫好就用yield返回。然後肯定不想只爬取一頁的書籍吧，那就一定要加循環了。仔細觀察後發現又100頁。所以循環如下：在我們寫pipel

>>阅读原文<<