80行代碼爬取豆瓣Top250電影信息並導出到csv及數據庫

時間 2020-07-23

原文原文鏈接

查看源碼html 1 下載頁面並處理 DOWNLOAD_URL = 'http://movie.douban.com/top250/' html = requests.get(url).text tree = lxml.html.fromstring(html) 2 提取數據觀察該網站html結構 mysql 可知該頁面下全部電影包含在 ol 標籤下。每一個 li 標籤包含單個電影的內容。git

>>阅读原文<<