Java開發筆記（九十一）IO流處理簡單的數據壓縮

時間 2019-11-10

原文原文鏈接

前面介紹的文件I/O，無論是寫入文本仍是寫入對象，文件中的數據基本是原來的模樣，用記事本之類的文本編輯軟件都能瀏覽個大概。這麼存儲數據，要說方便確實方便，只是不夠經濟划算，緣由有二：其一，寫入的數據可能存在大量重複的信息，但依原樣寫到文件的話，無疑保留了很多冗餘數據，形成空間浪費；其二，寫入的數據多以明文方式保存，容易產生信息泄露，安全性不高。爲此Java提供了簡單的壓縮和解壓工具，在將數據寫入文件以前，先對數據進行壓縮，再將壓縮後的結果寫到文件；一樣讀取壓縮文件之時，先讀出已壓縮的數據，再將這些數據進行解壓，解壓後的結果即爲最初的原始數據。
在IO流的家族體系中，壓縮與解壓操做須要GZIPOutputStream、GZIPInputStream、ByteArrayOutputStream、ByteArrayInputStream這四個工具類互相配合，分別簡述以下：
GZIPOutputStream：壓縮輸出流。它吃進去的是原始數據的字節數組，拉出來的是字節數組輸出流對象（壓縮後的數據）。
ByteArrayOutputStream：字節數組輸出流。它從壓縮輸出流獲取壓縮後的數據，並經過toByteArray方法輸出字節數組信息。或者從壓縮輸入流獲取解壓後的數據，並經過toByteArray方法輸出字節數組信息。
GZIPInputStream：壓縮輸入流。它吃進去的是字節數組輸入流對象（壓縮後的數據），拉出來的是解壓後的字節數組（原始數據）。
ByteArrayInputStream：字節數組輸入流。它輸入壓縮數據的字節數組，轉成流對象後丟給壓縮輸入流。
上面的工具介紹描述看上去索然無味，確實要運用到實際案例中才比較好理解。接下來先來瞧瞧原始字符串是怎麼變成壓縮數據的，詳細的壓縮過程代碼示例以下：html

	// 從字符串得到壓縮後的字節數組
	private static byte[] compress(String str) {
		if (str==null || str.length()<=0) {
			return null;
		}
		byte[] zip_bytes = null; // 聲明壓縮數據的字節數組
		// 先構建字節數組輸出流，再據此構建壓縮輸出流
		try (ByteArrayOutputStream baos = new ByteArrayOutputStream();
				GZIPOutputStream gos = new GZIPOutputStream(baos);) {
			gos.write(str.getBytes()); // 往壓縮輸出流寫入字節數組
			gos.finish(); // 結束寫入操做
			zip_bytes = baos.toByteArray(); // 從字節數組輸出流中獲取字節數組信息
		} catch (Exception e) {
			e.printStackTrace();
		}
		return zip_bytes;
	}

既已獲得壓縮後的字節數組，將其寫入文件之中真是易如反掌，下面是往文件寫入壓縮數據的代碼例子：數組

	// 往文件寫入壓縮後的數據
	private static void writeZipFile() {
		String str = "白日依山盡，黃河入海流。\n欲窮千里目，更上一層樓。";
		// 根據指定文件路徑構建文件輸出流對象
		try (FileOutputStream fos = new FileOutputStream(mFileName)) {
			// 從字符串得到壓縮後的字節數組
			byte[] zip_bytes = compress(str);
			fos.write(zip_bytes); // 把字節數組寫入文件輸出流
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

再來看看如何從壓縮文件中讀到解壓後的原始數據，把壓縮後的數據還原爲初始字符串要複雜一些，須要ByteArrayInputStream、GZIPInputStream、ByteArrayOutputStream三個工具互相配合，具體的解壓過程代碼以下所示：安全

	// 從壓縮字節數組得到解壓後的字符串
	private static String uncompress(byte[] bytes) {
		if (bytes==null || bytes.length<=0) {
			return null;
		}
		byte[] unzip_bytes = null; // 聲明解壓數據的字節數組
		// 分別構建字節數組輸出流，以及字節數組輸入流，並根據字節數組輸入流構建壓縮輸入流
		try (ByteArrayOutputStream baos = new ByteArrayOutputStream();
				ByteArrayInputStream bais = new ByteArrayInputStream(bytes);
				GZIPInputStream gis = new GZIPInputStream(bais);) {
			byte[] buffer = new byte[1024];
			while (true) {
				// 從壓縮輸入流中讀取數據到字節數組，並返回讀到的數據長度
				int length = gis.read(buffer);
				if (length < 0) { // 未讀到數據，表示已經讀完了
					break;
				}
				baos.write(buffer); // 往字節數組輸出流寫入字節數組
			}
			unzip_bytes = baos.toByteArray(); // 從字節數組輸出流中獲取字節數組信息
		} catch (Exception e) {
			e.printStackTrace();
		}
		return new String(unzip_bytes); // 把字節數組轉換爲字符串，並返回該字符串
	}

利用剛剛編寫的uncompress解壓方法，很容易從壓縮文件中獲得原始字符串，下面是從壓縮文件讀取解壓數據的代碼例子：工具

	// 從壓縮文件中讀取解壓後的數據
	private static void readZipFile() {
		// 根據指定文件路徑構建文件輸入流對象
		try (FileInputStream fis = new FileInputStream(mFileName)) {
			// 分配長度爲文件大小的字節數組。available方法返回當前未讀取的大小
			byte[] bytes = new byte[fis.available()];
			fis.read(bytes); // 從文件輸入流中讀取字節數組
			// 從壓縮字節數組得到解壓後的字符串
			String content = uncompress(bytes);
			System.out.println("content="+content);
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

更多Java技術文章參見《Java開發筆記（序）章節目錄》htm