圖書爬蟲的進展

豆瓣的數據抓取中,豆瓣的反扒措施比較嚴謹,這裏不得已採用了芝麻代理的ip,豆瓣的數據整理的比較好。代理

另外也對比過京東和噹噹的數據,發現噹噹的圖書數據是最亂的。ip

相關文章
相關標籤/搜索