requests+正則表達式爬取豆瓣讀書top250

簡單的python聯手項目,通過rquests庫請求得到豆瓣top250網頁源代碼,並通過正則表達式匹配得到對應信息-書名,作者信息,評分以及簡介。 網站的URL爲’https://book.douban.com/top250?start=0’,但我們拉到底部發現250本讀書的信息被分成了10頁,這就需要我們首先對URL的規律進行分析得到所有頁面的URL信息傳遞給get()方法中請求源代碼。 點擊
相關文章
相關標籤/搜索