初學python,感受用起來比c\c++順手多了。(水平菜鳥,沒有黑的意思)html
python能夠快速寫一些小腳本幫助平常上網,好比在帖吧看到很好的照片,可是比較多,一百多張攝影做品或者劇照什麼的,一張一張下載起來何其傻逼呀。咱們學計算機的豈能吃素的,話很少說,開始。python
1.首先找到打開目標網頁的源代碼,找到圖片的代碼,比較煩,但通常是src=***.jpg之類的。反正帖吧是這樣,有些網站可能有點小差別。c++
2.下一步的任務是獲取html代碼,python有個模塊urllib裏面有函數能夠幫忙正則表達式
import re import urllib def getHtml(url): page = urllib.urlopen(url) html = page.read() return html
那個re模塊是正則表達式要用的。函數
ok,如今能夠print檢查一下html是否獲取。(新手習慣~~)網站
3. 以後就能夠獲取圖片了url
def getImg(html): reg = r"src = '(.+\.jpg)'width" imgre = re.compile(reg) imglist = re.findall(imgre,html) x = 0 for imgurl in imglist: urllib.urlretrieve(imgurl,'%s,jpg' % x) x+=1
有兩個地方解釋一下,第二行的代碼是正則表達式,可能因網頁圖片地址而異。
x變量則是編號圖片,防止圖片下載覆蓋原來的文件。code
最後只要執行這兩個函數就能夠自動下載到腳本所在文件夾了htm