爬蟲系列之豆瓣圖書排行

豆瓣上有圖書的排行榜,所以這次寫了一個豆瓣的爬蟲。 首先是分析排行榜的url 根據這個可以很容易的知道不同圖書的排行榜就是在網站後面加上/tag/【類別】,所以我們首先要獲得圖書的類別信息。 這裏可以將讀書首頁的熱門標籤給爬下來。             爬取標籤內容並不難,代碼如下: 1 def getLabel(url): #獲得熱門標籤 2 html = getHTMLTe
相關文章
相關標籤/搜索