Java開發筆記(九十一)IO流處理簡單的數據壓縮

前面介紹的文件I/O,無論是寫入文本仍是寫入對象,文件中的數據基本是原來的模樣,用記事本之類的文本編輯軟件都能瀏覽個大概。這麼存儲數據,要說方便確實方便,只是不夠經濟划算,緣由有二:其一,寫入的數據可能存在大量重複的信息,但依原樣寫到文件的話,無疑保留了很多冗餘數據,形成空間浪費;其二,寫入的數據多以明文方式保存,容易產生信息泄露,安全性不高。爲此Java提供了簡單的壓縮和解壓工具,在將數據寫入文件以前,先對數據進行壓縮,再將壓縮後的結果寫到文件;一樣讀取壓縮文件之時,先讀出已壓縮的數據,再將這些數據進行解壓,解壓後的結果即爲最初的原始數據。
在IO流的家族體系中,壓縮與解壓操做須要GZIPOutputStream、GZIPInputStream、ByteArrayOutputStream、ByteArrayInputStream這四個工具類互相配合,分別簡述以下:
GZIPOutputStream:壓縮輸出流。它吃進去的是原始數據的字節數組,拉出來的是字節數組輸出流對象(壓縮後的數據)。
ByteArrayOutputStream:字節數組輸出流。它從壓縮輸出流獲取壓縮後的數據,並經過toByteArray方法輸出字節數組信息。或者從壓縮輸入流獲取解壓後的數據,並經過toByteArray方法輸出字節數組信息。
GZIPInputStream:壓縮輸入流。它吃進去的是字節數組輸入流對象(壓縮後的數據),拉出來的是解壓後的字節數組(原始數據)。
ByteArrayInputStream:字節數組輸入流。它輸入壓縮數據的字節數組,轉成流對象後丟給壓縮輸入流。
上面的工具介紹描述看上去索然無味,確實要運用到實際案例中才比較好理解。接下來先來瞧瞧原始字符串是怎麼變成壓縮數據的,詳細的壓縮過程代碼示例以下:html

	// 從字符串得到壓縮後的字節數組
	private static byte[] compress(String str) {
		if (str==null || str.length()<=0) {
			return null;
		}
		byte[] zip_bytes = null; // 聲明壓縮數據的字節數組
		// 先構建字節數組輸出流,再據此構建壓縮輸出流
		try (ByteArrayOutputStream baos = new ByteArrayOutputStream();
				GZIPOutputStream gos = new GZIPOutputStream(baos);) {
			gos.write(str.getBytes()); // 往壓縮輸出流寫入字節數組
			gos.finish(); // 結束寫入操做
			zip_bytes = baos.toByteArray(); // 從字節數組輸出流中獲取字節數組信息
		} catch (Exception e) {
			e.printStackTrace();
		}
		return zip_bytes;
	}

 

既已獲得壓縮後的字節數組,將其寫入文件之中真是易如反掌,下面是往文件寫入壓縮數據的代碼例子:數組

	// 往文件寫入壓縮後的數據
	private static void writeZipFile() {
		String str = "白日依山盡,黃河入海流。\n欲窮千里目,更上一層樓。";
		// 根據指定文件路徑構建文件輸出流對象
		try (FileOutputStream fos = new FileOutputStream(mFileName)) {
			// 從字符串得到壓縮後的字節數組
			byte[] zip_bytes = compress(str);
			fos.write(zip_bytes); // 把字節數組寫入文件輸出流
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

 

再來看看如何從壓縮文件中讀到解壓後的原始數據,把壓縮後的數據還原爲初始字符串要複雜一些,須要ByteArrayInputStream、GZIPInputStream、ByteArrayOutputStream三個工具互相配合,具體的解壓過程代碼以下所示:安全

	// 從壓縮字節數組得到解壓後的字符串
	private static String uncompress(byte[] bytes) {
		if (bytes==null || bytes.length<=0) {
			return null;
		}
		byte[] unzip_bytes = null; // 聲明解壓數據的字節數組
		// 分別構建字節數組輸出流,以及字節數組輸入流,並根據字節數組輸入流構建壓縮輸入流
		try (ByteArrayOutputStream baos = new ByteArrayOutputStream();
				ByteArrayInputStream bais = new ByteArrayInputStream(bytes);
				GZIPInputStream gis = new GZIPInputStream(bais);) {
			byte[] buffer = new byte[1024];
			while (true) {
				// 從壓縮輸入流中讀取數據到字節數組,並返回讀到的數據長度
				int length = gis.read(buffer);
				if (length < 0) { // 未讀到數據,表示已經讀完了
					break;
				}
				baos.write(buffer); // 往字節數組輸出流寫入字節數組
			}
			unzip_bytes = baos.toByteArray(); // 從字節數組輸出流中獲取字節數組信息
		} catch (Exception e) {
			e.printStackTrace();
		}
		return new String(unzip_bytes); // 把字節數組轉換爲字符串,並返回該字符串
	}

 

利用剛剛編寫的uncompress解壓方法,很容易從壓縮文件中獲得原始字符串,下面是從壓縮文件讀取解壓數據的代碼例子:工具

	// 從壓縮文件中讀取解壓後的數據
	private static void readZipFile() {
		// 根據指定文件路徑構建文件輸入流對象
		try (FileInputStream fis = new FileInputStream(mFileName)) {
			// 分配長度爲文件大小的字節數組。available方法返回當前未讀取的大小
			byte[] bytes = new byte[fis.available()];
			fis.read(bytes); // 從文件輸入流中讀取字節數組
			// 從壓縮字節數組得到解壓後的字符串
			String content = uncompress(bytes);
			System.out.println("content="+content);
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

 


更多Java技術文章參見《Java開發筆記(序)章節目錄htm

相關文章
相關標籤/搜索