python：Requests+正則爬取網頁數據

時間 2021-01-05

原文原文鏈接

1.分析網頁確定思路打算爬取貓眼電影的 top 100 的電影信息，我們首先可以訪問一下我們需要爬取的網站，看一下我們需要的信息所處的位置和結構如何看完以後我們的思路應該就比較清晰了，我們首先使用 requests 庫請求單頁內容，然後我們使用正則對我們需要的信息進行匹配，然後將我們需要的每一條信息保存成一個JSON 字符串，並將其存入文件當中，然後就是開啓循環遍歷十頁的內容或者採用 Pyth

>>阅读原文<<