Python爬蟲學習-豆瓣電影TOP250數據爬取(存入mongo數據庫中)

利用了晚上的閒暇時間,想對正則表達式+requests進行爬蟲練習,故決定對豆瓣電影top(https://movie.douban.com/top250)排名進行數據爬取。因爲是簡單的網絡頁面,所以使用requests更爲方便。 爬蟲的思路還是分爲三步:爬取頁面、提取數據、保存數據。 爬取頁面 爬取的過程中並沒有遇到反爬措施,所以較爲頁面爬取相對簡單。 提取數據 通過觀察每類數據的共同之處,再用
相關文章
相關標籤/搜索