噹噹網書籍數據爬進數據庫

噹噹網書籍數據爬進數據庫 首先我們要考慮到噹噹網有沒有反爬機制,幾次後發現是沒有的。 一開始我們要考慮我們要爬取的信息是哪些,然後在items.py下面全部寫出來。 然後就寫爬蟲文件 從核心文件開始定位導入items裏面的類。(一定不要導入錯了) 對應的爬取地址寫好就用yield返回。 然後肯定不想只爬取一頁的書籍吧,那就一定要加循環了。 仔細觀察後發現又100頁。所以循環如下:在我們寫pipel
相關文章
相關標籤/搜索