Selenium2+python自動化37-爬頁面源碼（page_source）【轉載】

時間 2021-01-09

原文原文鏈接

前言有時候通過元素的屬性的查找頁面上的某個元素，可能不太好找，這時候可以從源碼中爬出想要的信息。selenium的page_source方法可以獲取到頁面源碼。 selenium的page_source方法很少有人用到，小編最近看api不小心發現這個方法，於是突發奇想，這裏結合python的re模塊用正則表達式爬出頁面上所有的url地址，可以批量請求頁面url地址，看是否存在404等異常一、p

>>阅读原文<<