一個抓取豆瓣圖書的開源爬蟲的詳細步驟

簡介 基於numpy和bs4的豆瓣圖書爬蟲,可以分類爬取豆瓣讀書300多萬本圖書信息,包括標題、作者、定價、頁數、出版信息等 github地址:https://github.com/lanbing510/DouBanSpider  項目作者:lanbing510 1 可以爬下豆瓣讀書標籤下的所有圖書 2 按評分排名依次存儲 3 存儲到Excel中,可方便大家篩選蒐羅,比如篩選評價人數>1000的高
相關文章
相關標籤/搜索