文章內容由--「腳本之家「--提供,在此感謝腳本之家的貢獻,該網站網址爲:https://www.jb51.net/html
zipfile是python裏用來作zip格式編碼的壓縮和解壓縮的,因爲是很常見的zip格式,因此這個模塊使用頻率也是比較高的,python
在這裏對zipfile的使用方法作一些記錄。即方便本身也方便別人。編程
Python zipfile模塊用來作zip格式編碼的壓縮和解壓縮的,要進行相關操做,首先須要實例化一個 ZipFile 對象。ZipFile 接受一個字符串格式壓縮包名稱做爲它的必選參數,第二個參數爲可選參數,表示打開模式,相似於文件操做,有r/w/a三種模式,分別表明讀、寫、添加,默認爲r,即讀模式。app
zipfile裏有兩個很是重要的class, 分別是ZipFile和ZipInfo, 在絕大多數的狀況下,咱們只須要使用這兩個class就能夠了。ZipFile是主要的類,用來建立和讀取zip文件而ZipInfo是存儲的zip文件的每一個文件的信息的。函數
好比要讀取一個Python zipfile 模塊,這裏假設filename是一個文件的路徑:測試
import zipfile z =zipfile.ZipFile(filename, 'r') # 這裏的第二個參數用r表示是讀取zip文件,w是建立一個zip文件 for f in z.namelist(): print f
上面的代碼是讀取一個zip壓縮包裏全部文件的名字。z.namelist() 會返回壓縮包內全部文件名的列表。
再看看下面一個:優化
import zipfile z = zipfile.ZipFile(filename, 'r') for i in z.infolist(): print i.file_size, i.header_offset
這裏使用了z.infolist(), 它返回的就是壓縮包內全部文件的信息,就是一個ZipInfo的列表。一個ZipInfo對象中包含了壓縮包內一個文件的信息,其中比較經常使用的是 filename, file_size, header_offset, 分別爲文件名,文件大小,文件數據在壓縮包中的偏移。其實以前的z.namelist()就是讀取的ZipInfo中的filename,組成一個 list返回的。
從壓縮包裏解壓縮出一個文件的方法是使用ZipFile的read方法:網站
import zipfile z = zipfile.ZipFile(filename, 'r') print z.read(z.namelist()[0])
這樣就讀取出z.namelist()中的第一個文件,而且輸出到屏幕,固然也能夠把它存儲到文件。下面是建立zip壓縮包的方法,與讀取的方法其實很相似的:編碼
import zipfile, os z = zipfile.ZipFile(filename, 'w') # 注意這裏的第二個參數是w,這裏的filename是壓縮包的名字
假設要把一個叫testdir中的文件所有添加到壓縮包裏(這裏只添加一級子目錄中的文件):加密
if os.path.isdir(testdir): for d in os.listdir(testdir): z.write(testdir+os.sep+d) # close() 是必須調用的! z.close()
面的代碼很是的簡單。想一想還有一個問題,若是我把一個test/111.txt 添加到壓縮包裏以後我但願在包裏它放到test22/111.txt怎麼辦呢?其實這個就是Python ZipFile模塊的write方法中第二個參數的做用了。只須要這樣調用:
z.write("test/111.txt", "test22/111.txt")
一、class zipfile.ZipFile(file[, mode[, compression[, allowZip64]]])
建立一個ZipFile對象,表示一個zip文件。參數file表示文件的路徑或類文件對象(file-like object);參數mode指示打開zip文件的模式,
默認值爲'r',表示讀已經存在的zip文件,也能夠爲'w'或'a','w'表示新建一個zip文檔或覆蓋一個已經存在的zip文檔,
import zipfile f = zipfile.ZipFile(filename, 'r') # 這裏的第二個參數用r表示是讀取zip文件,w或a是建立一個zip文件 for f_name in f.namelist(): #z.namelist() 會返回壓縮包內全部文件名的列表。 print(f_name) #上面的代碼是讀取一個zip壓縮包裏全部文件的名字。
'a'表示將數據附加到一個現存的zip文檔中。參數compression表示在寫zip文檔時使用的壓縮方法,它的值能夠是zipfile. ZIP_STORED 或zipfile. ZIP_DEFLATED。若是要操做的zip文件大小超過2G,應該將allowZip64設置爲True。
ZipFile還提供了以下經常使用的方法和屬性:
ZipFile.getinfo(name)
獲取zip文檔內指定文件的信息。返回一個zipfile.ZipInfo對象,它包括文件的詳細信息。
ZipFile.infolist()
獲取zip文檔內全部文件的信息,返回一個zipfile.ZipInfo的列表。
ZipFile.namelist()
獲取zip文檔內全部文件的名稱列表。
ZipFile.extract(member[, path[, pwd]])
將zip文檔內的指定文件解壓到當前目錄。參數member指定要解壓的文件名稱或對應的ZipInfo對象;參數path指定了解析文件保存的文件夾;
參數pwd爲解壓密碼。下面一個例子將保存在程序根目錄下的duoduo.zip內的全部文件解壓到D:/Work目錄:
import zipfile, os f = zipfile.ZipFile(os.path.join(os.getcwd(), 'duoduo.zip')) #拼接成一個路徑 for file in f.namelist(): f.extract(file, r'd:/Work') #在d:/Work中解壓文件 f.close()
上面是os.getcwd的用法!!
ZipFile.extractall([path[, members[, pwd]]])
解壓zip文檔中的全部文件到當前目錄。參數members的默認值爲zip文檔內的全部文件名稱列表,也能夠本身設置,選擇要解壓的文件名稱。
ZipFile.printdir()
將zip文檔內的信息打印到控制檯上。
ZipFile.setpassword(pwd)
設置zip文檔的密碼。
ZipFile.read(name[, pwd])
獲取zip文檔內指定文件的二進制數據。下面的例子演示了read()的使用,zip文檔內包括一個duoduo.txt的文本文件,使用read()方法讀取其二進制數據,而後保存到D:/duoduo.txt。
import zipfile, os zipFile = zipfile.ZipFile(os.path.join(os.getcwd(), 'duoduo.zip')) data = zipFile.read('duoduo.txt') # (lambda f, d: (f.write(d), f.close()))(open(r'd:/duoduo.txt', 'wb'), data) #一行語句就完成了寫文件操做。仔細琢磨哦~_~ with open(r'd:/duoduo.txt','wb') as f: for d in data: f.write(d) zipFile.close()
ZipFile.write(filename[, arcname[, compress_type]])
將指定文件添加到zip文檔中。filename爲文件路徑,arcname爲添加到zip文檔以後保存的名稱, 參數compress_type表示壓縮方法,它的值能夠是zipfile. ZIP_STORED 或zipfile. ZIP_DEFLATED。下面的例子演示瞭如何建立一個zip文檔,並將文件D:/test.doc添加到壓縮文檔中。
import zipfile, os zipFile = zipfile.ZipFile(r'D:/test.zip'), 'w') zipFile.write(r'D:/test.doc', '保存的名字', zipfile.ZIP_DEFLATED) zipFile.close()
ipFile.writestr(zinfo_or_arcname, bytes)
writestr()支持將二進制數據直接寫入到壓縮文檔。
二、Class ZipInfo
ZipFile.getinfo(name) 方法返回的是一個ZipInfo對象,表示zip文檔中相應文件的信息。它支持以下屬性:
ZipInfo.filename: 獲取文件名稱。
ZipInfo.date_time: 獲取文件最後修改時間。返回一個包含6個元素的元組:(年, 月, 日, 時, 分, 秒)
ZipInfo.compress_type: 壓縮類型。
ZipInfo.comment: 文檔說明。
ZipInfo.extr: 擴展項數據。
ZipInfo.create_system: 獲取建立該zip文檔的系統。
ZipInfo.create_version: 獲取 建立zip文檔的PKZIP版本。
ZipInfo.extract_version: 獲取 解壓zip文檔所需的PKZIP版本。
ZipInfo.reserved: 預留字段,當前實現老是返回0。
ZipInfo.flag_bits: zip標誌位。
ZipInfo.volume: 文件頭的卷標。
ZipInfo.internal_attr: 內部屬性。
ZipInfo.external_attr: 外部屬性。
ZipInfo.header_offset: 文件頭偏移位。
ZipInfo.CRC: 未壓縮文件的CRC-32。
ZipInfo.compress_size: 獲取壓縮後的大小。
ZipInfo.file_size: 獲取未壓縮的文件大小。
下面一個簡單的例子說明這些屬性的意思:
import zipfile, os zipFile = zipfile.ZipFile(os.path.join(os.getcwd(), 'duoduo.zip')) zipInfo = zipFile.getinfo('文件中的文件.txt') print ('filename:', zipInfo.filename) #獲取文件名稱 print ('date_time:', zipInfo.date_time) #獲取文件最後修改時間。返回一個包含6個元素的元組:(年, 月, 日, 時, 分, 秒) print ('compress_type:', zipInfo.compress_type) #壓縮類型 print ('comment:', zipInfo.comment) #文檔說明 print ('extra:', zipInfo.extra) #擴展項數據 print ('create_system:', zipInfo.create_system) #獲取建立該zip文檔的系統。 print ('create_version:', zipInfo.create_version) #獲取 建立zip文檔的PKZIP版本。 print ('extract_version:', zipInfo.extract_version) #獲取 解壓zip文檔所需的PKZIP版本。 print ('extract_version:', zipInfo.reserved) # 預留字段,當前實現老是返回0。 print ('flag_bits:', zipInfo.flag_bits) #zip標誌位。 print ('volume:', zipInfo.volume) # 文件頭的卷標。 print ('internal_attr:', zipInfo.internal_attr) #內部屬性。 print ('external_attr:', zipInfo.external_attr) #外部屬性。 print ('header_offset:', zipInfo.header_offset) # 文件頭偏移位。 print ('CRC:', zipInfo.CRC) # 未壓縮文件的CRC-32。 print ('compress_size:', zipInfo.compress_size) #獲取壓縮後的大小。 print ('file_size:', zipInfo.file_size) #獲取未壓縮的文件大小。 zipFile.close() #
import zipfile import StringIO class InMemoryZip(object): def __init__(self): # Create the in-memory file-like object self.in_memory_zip = StringIO.StringIO() def append(self, filename_in_zip, file_contents): '''Appends a file with name filename_in_zip and contents of file_contents to the in-memory zip.''' # Get a handle to the in-memory zip in append mode zf = zipfile.ZipFile(self.in_memory_zip, "a", zipfile.ZIP_DEFLATED, False) # Write the file to the in-memory zip zf.writestr(filename_in_zip, file_contents) # Mark the files as having been created on Windows so that # Unix permissions are not inferred as 0000 for zfile in zf.filelist: zfile.create_system = 0 return self def read(self): '''Returns a string with the contents of the in-memory zip.''' self.in_memory_zip.seek(0) return self.in_memory_zip.read() def writetofile(self, filename): '''Writes the in-memory zip to a file.''' f = file(filename, "w") f.write(self.read()) f.close() if __name__ == "__main__": # Run a test imz = InMemoryZip() imz.append("test.txt", "Another test").append("test2.txt", "Still another") imz.writetofile("test.zip")
Python讀zip文件
下面的代碼給出了用Python讀取zip文件,打印出壓縮文件裏面全部的文件,並讀取壓縮文件中的第一個文件。
import zipfile z = zipfile.ZipFile("zipfile.zip", "r") #打印zip文件中的文件列表 for filename in z.namelist( ): print 'File:', filename #讀取zip文件中的第一個文件 first_file_name = z.namelist()[0] content = z.read(first_file_name) print first_file_name print content
Python寫/建立zip文件
Python寫Zip文件主要用到ZipFile的write函數。
import zipfile z = zipfile.ZipFile('test.zip', 'w', zipfile.ZIP_DEFLATED) z.write('test.html') z.close( )
在建立ZipFile實例的時候,有2點藥注意:
1.要用'w'或'a'模式,用可寫的方式打開zip文件
2.壓縮模式有ZIP_STORED 和 ZIP_DEFLATED,ZIP_STORED只是存儲模式,不會對文件進行壓縮,這個是默認值,若是你須要對文件進行壓縮,必須使用ZIP_DEFLATED模式。
首先咱們先來桌面建立一個文件
咱們建立了一個名爲q的txt文件而後咱們將它壓縮,壓縮的時候記得設置上密碼
我這邊將密碼設置爲123456
使用python的zipfile的模塊,編寫zip文件口令破解機。須要用到 Zip File類中的 extractall方法。這個類和這個方法對咱們編程破解有口令保護的Zip文件是頗有用的。請注意 extractant(方法用可選參數指定密碼的方式。
導入庫後,用帶有口令保護的Zip文件的文件名,實例化一個新的 Zipfile類。要解壓這個Zip文件,咱們使用 extractall方法,並在可選參數pwd上填入口令。
建立一個.py文件,在根目錄而後在將咱們的壓縮文件放入同目錄裏面,項目結構目錄:
咱們.py文件的代碼:
import zipfile zipFile = zipfile.ZipFile("q.zip","r")//這裏是咱們的壓縮文件 zipFile.extractall(pwd="123456")//這裏是咱們的密碼
這段代碼其實就是拿着密碼去解壓咱們剛剛壓縮的文件,網上大多數教程都是這樣寫的,可是我這邊使用python3.6就會發現運行的時候報錯了:
反正錯誤大概的意思就是pwd的接收的數據應該是bytes類型可是它獲得的倒是str類型的反正就是類型錯了,那咱們就將密碼轉換爲bytes類型,咱們的py文件的代碼以下:
import zipfile zipFile = zipfile.ZipFile("q.zip","r") password = '123456' zipFile.extractall(pwd=str.encode(password) )
這時候咱們再次運行項目
此次沒有報錯
咱們能夠看到在咱們的項目根目錄下多了一個文件就是咱們以前壓縮的那個文件
接下來咱們繼續改造,若是用一個錯誤密碼執行這個腳本會發生什麼狀況?讓咱們在腳本中增長一些捕獲和處理異常的代碼,顯示錯誤的信息。
import zipfile zipFile = zipfile.ZipFile("q.zip","r") try: password = '123s456' zipFile.extractall(pwd=str.encode(password)) except Exception as ex: print(ex)
這時候咱們的py文件代碼,而且咱們還將密碼故意寫錯來測試一下,來看一下運行結果
在這裏咱們能夠看到錯誤 信息,就是告訴咱們密碼錯誤
咱們能夠用因口令不正確而拋出的異常來測試咱們的字典文件(接下來的zidian.text)中是否有Zip文件的口令。實例化一個 Zip File類以後,咱們打開字典文件,遍歷並測試字典中的每一個單詞。若是 extractall0函數的執行沒有出錯,則打印一條消息,輸出正確的口令。可是,若是 extractall()函數拋出了一個口令錯誤的異常,就忽略這個異常,並繼續測試字典中的下一個口令。
咱們先建立一個zidian.text文件
接下來咱們在zidian.text文件中編寫咱們的密碼字典,每一行一個密碼,紅色部分是咱們的正確密碼
而後將咱們的密碼字典放入項目中
接着咱們繼續修改咱們的腳本
zipFile = zipfile.ZipFile("q.zip","r") #打開咱們的字典表 passFile = open('zidian.txt') for line in passFile.readlines(): #讀取每一行數據(每個密碼) password = line.strip('\n') try: zipFile.extractall(pwd=str.encode(password)) print('=========密碼是:'+password+'\n') #若是密碼正確退出程序 exit(0) except Exception as ex: #跳過 pass
接下來咱們看一下運行結果
哈哈咱們已經成功破解了zip文件的密碼,到這裏咱們不難發現只要咱們字典裏面有密碼咱們就能夠破解出來
咱們繼續將咱們的項目優化一下:
import zipfile def extractFile(zFile,password): try: zFile.extractall(pwd=str.encode(password)) #若是成功返回密碼 return password except: return def main(): zFile = zipfile.ZipFile("q.zip","r") #打開咱們的字典表 passFile = open('zidian.txt') for line in passFile.readlines(): #讀取每一行數據(每個密碼) password = line.strip('\n') guess = extractFile(zFile,password) if (guess): print("=========密碼是:"+password+"\n") exit(0) if __name__=='__main__': main()
這樣就好多了!
接下來再給你們貼一個生成所有六位數數字密碼的代碼:
f = open('zidian.txt','w') for id in range(1000000): password = str(id).zfill(6)+'\n' f.write(password) f.close()
運行成功後咱們能夠看到再咱們的zidian.txt已經生成好了從000000到999999都有了這樣咱們只要是6位數數字密碼的zip文件咱們均可以破解了!