函數:urllib.urlretrieve(url[, filename[, reporthook[, data]]])
參數說明:
url:外部或者本地url ,url中不要含有中文,好像會出錯。
filename:指定了保存到本地的路徑(若是未指定該參數,urllib會生成一個臨時文件來保存數據);
reporthook:是一個回調函數,當鏈接上服務器、以及相應的數據塊傳輸完畢的時候會觸發該回調。咱們能夠利用這個回調函數來顯示當前的下載進度。
data:指post到服務器的數據。該方法返回一個包含兩個元素的元組(filename, headers),filename表示保存到本地的路徑,header表示服務器的響應頭。 html
抓取百度首頁進行保存的例子以下:服務器
1 from urllib import request 2 def fun(blocknum,blocksize,totalsize): 3 """ 4 blocknum:當前的塊編號 5 blocksize:每次傳輸的塊大小 6 totalsize:網頁文件總大小 7 """ 8 percent = blocknum*blocksize/totalsize 9 if percent > 1.0: 10 percent = 1.0 11 percent = percent*100 12 print("download : %.2f%%" %(percent)) 13 url = "http://www.baidu.com" 14 path = r"C:\Users\Administrator\Desktop\download\sina.html" 15 request.urlretrieve(url, path, fun)