python爬蟲系列(1)——一個簡單的爬蟲實例

本文主要實現一個簡單的爬蟲,目的是從一個百度貼吧頁面下載圖片。 1. 概述 本文主要實現一個簡單的爬蟲,目的是從一個百度貼吧頁面下載圖片。下載圖片的步驟如下: 獲取網頁html文本內容; 分析html中圖片的html標籤特徵,用正則解析出所有的圖片url鏈接列表; 根據圖片的url鏈接列表將圖片下載到本地文件夾中。 2. urllib+re實現 #!/usr/bin/python # coding
相關文章
相關標籤/搜索