Python 爬蟲從入門到進階之路(九)

之前的文章我們介紹了一下 Python 中的正則表達式和與爬蟲正則相關的 re 模塊,本章我們就利用正則表達式和 re 模塊來做一個案例,爬取《糗事百科》的糗事並存儲到本地。 我們要爬取的網站鏈接是 https://www.qiushibaike.com/text/page/1/ 。 我們要爬取的是裏面的糗事,在之前的文章中我們已經可以爬取整個 url 鏈接裏的 html 內容,那麼我們就可以根據
相關文章
相關標籤/搜索