python如何批量下載帖吧圖片

初學python,感受用起來比c\c++順手多了。(水平菜鳥,沒有黑的意思)html

python能夠快速寫一些小腳本幫助平常上網,好比在帖吧看到很好的照片,可是比較多,一百多張攝影做品或者劇照什麼的,一張一張下載起來何其傻逼呀。咱們學計算機的豈能吃素的,話很少說,開始。python

1.首先找到打開目標網頁的源代碼,找到圖片的代碼,比較煩,但通常是src=***.jpg之類的。反正帖吧是這樣,有些網站可能有點小差別。c++

2.下一步的任務是獲取html代碼,python有個模塊urllib裏面有函數能夠幫忙正則表達式

import re
import urllib

def  getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

那個re模塊是正則表達式要用的。函數

ok,如今能夠print檢查一下html是否獲取。(新手習慣~~)網站

3. 以後就能夠獲取圖片了url

def getImg(html):
    reg = r"src = '(.+\.jpg)'width"
    imgre = re.compile(reg)
    imglist = re.findall(imgre,html)
    x = 0
    for imgurl in imglist:
        urllib.urlretrieve(imgurl,'%s,jpg' % x)
        x+=1

有兩個地方解釋一下,第二行的代碼是正則表達式,可能因網頁圖片地址而異。
x變量則是編號圖片,防止圖片下載覆蓋原來的文件。code

最後只要執行這兩個函數就能夠自動下載到腳本所在文件夾了htm

相關文章
相關標籤/搜索