Day-3頁面分析（Xpath）

時間 2021-01-22

原文原文鏈接

一、爬取分析爬蟲是非常考驗隨機性的，運氣性，以及思維跳躍的在此次項目中，首先我們找到京東圖書的頁面，進入到裏邊京東所有圖書的API接口是： http:/book.jd.com/booksort.html （建議自己去京東網站自己找一下）對於每一本書來說，它都會有大分類，小分類思考： 1.分類的爬取 2.翻頁 ---> nextwork（谷歌檢查) 3.循環遍歷的終點 4.如何判斷當前

>>阅读原文<<