Python網絡爬蟲:利用正則表達式方法爬取‘’豆瓣讀書‘’中‘’新書速遞‘’條目

1.簡述:正則表達式是爬蟲的方法之一,這裏利用Requests庫進行爬取,儘管Urllib也能進行爬取,但過程過於繁瑣,在瞭解Urllib的爬取過程後,沒有進行實戰演練,但在學習了Requests的爬取後,進行了實戰學習,由於考慮到確實以後會多用到Requests包,因此這一步仍是要好好掌握學習一下的:)另外,還用到re包,主要在利用正則表達式進行爬蟲是時用到匹配(re.match)、查找(re.
相關文章
相關標籤/搜索