爬蟲:刪除爬取內容中不須要的標籤

問題:例如咱們使用爬蟲爬取到一篇文章,可是該文章有一些影響標籤(例如打賞),那麼咱們可使用以下方法刪除該標籤: 方法一(字符串的strip): # 使用xpath尋找須要刪除的div,若是該標籤存在,那麼在原文章理使用strip方法刪除 del_div = response.xpath(del_xpath).extract_first() if del_div: article = art
相關文章
相關標籤/搜索