requests+正則表達式爬取豆瓣讀書top250

時間 2021-01-16

原文原文鏈接

簡單的python聯手項目，通過rquests庫請求得到豆瓣top250網頁源代碼，並通過正則表達式匹配得到對應信息-書名，作者信息，評分以及簡介。網站的URL爲’https://book.douban.com/top250?start=0’,但我們拉到底部發現250本讀書的信息被分成了10頁，這就需要我們首先對URL的規律進行分析得到所有頁面的URL信息傳遞給get（）方法中請求源代碼。點擊

>>阅读原文<<