本文主要實現一個簡單的爬蟲,目的是從一個百度貼吧頁面下載圖片。html
本文主要實現一個簡單的爬蟲,目的是從一個百度貼吧頁面下載圖片。下載圖片的步驟以下:java
獲取網頁html文本內容;
分析html中圖片的html標籤特徵,用正則解析出全部的圖片url連接列表;
根據圖片的url連接列表將圖片下載到本地文件夾中。python
運行上面腳本,過幾秒種以後完成下載,能夠在當前目錄下看到圖片已經下載好了:app
下面用requests庫實現下載,把getHtmlContent和downloadJPG函數都用requests從新實現。python爬蟲
輸出:和前面同樣。函數
原文連接:url
https://www.cnblogs.com/jiayongji/p/7118934.htmlspa
-END-code