出處:http://u6.gg/swLPgjava
編寫 Java 代碼的時候,大多數狀況下,咱們不多關注一個 Java 對象究竟有多大(佔據多少內存),更多的是關注業務與邏輯。程序員
可是卻不知,在咱們不經意間,大量的內存被無形地浪費了。數據庫
想要精確計算一個 Java 對象佔用的內存,首先要了解 Java 對象的結構表示。數組
一個 Java 對象在 Heap 的表示,能夠分爲三部分:bash
Object Header微信
Class Pointer架構
Fields負載均衡
每一個普通 Java 對象在堆(heap)中都有一個頭信息(object header),頭信息是必不可少的,記錄着對象的狀態。工具
32 位與 64 位佔用空間不一樣,在 32 位中:性能
hash(25)+age(4)+lock(3)=32bit複製代碼
64 位中:
unused(25+1)+hash(31)+age(4)+lock(3)=64bit複製代碼
咱們知道,在 Java 中,一切皆對象;每一個類都有一個父類, ClassPointer 就是當前對象父類的一個指針。
在 32 位系統中,這個指針爲 4byte;
在 64 位系統中,若是開啓指針壓縮(-XX:+UseCompressedOops)或者 JVM 堆的最大值小於 32G,這個指針也是 4byte,不然是 8byte。
關於字段(Fields),這裏指的是類的實例字段;也就是說不包括靜態字段,由於這個字段是共享內存的,只會存在一份。
下面以 32 位系統爲例子,計算一下 java.lang.Integer 到底佔用多大內存:
ObjectHeader 和 Pointer 都是固定的,4+4=8byte 。
再看看字段,只有這一個,表示數值:
/** * The value of the <code>Integer</code>. * * @serial */private final int value;複製代碼
一個 int 在 java 中佔據 4byte,因此 Integer 的大小爲 4+4+4=12byte。
這個結果對嗎?
不對!
還有一點沒有說: 在 java,對象佔用的 heap 大小是 8 位對齊的,上面的 12byte 沒有對齊,因此須要補位 4byte。結果是 16byte!
另外,在 Java中 還有一種特殊的對象, 數組!
沒錯,這個對象有點特殊,它比其餘對象多了一個屬性:長度(length)。
因此咱們計算數組長度的時候,須要額外加上一個長度的字段,即一個 int 的大小。
例如:int[] arr = new int[10];
arr 的佔用 heap 大小爲:
4(object header)+4(pointer)+4(length)+4*10(10個int大小)=52byte 因爲須要 8 位對齊,因此最終大小爲 56byte。
在瞭解了對象的內存使用狀況後,咱們能夠簡單算一筆賬。
一個 java.lang.Integer 佔用 16byte,而一個 int 佔用 4byte,4:1 的比例。
也就是說整數的類類型是基本類型內存的 4 倍!
由此咱們得出第一個節約內存的原則:
(1) 儘可能使用基本類型,而不是包裝類型。
數據庫建表的時候字段類型須要仔細推敲,一樣 JavaBean 中的屬性字段類型也須要仔細斟酌。
不要吝嗇使用 short,byte,boolean,若是短類型能放下數據,儘可能不要使用更長的類型。
一個 long 比一個 int 纔多 4byte,可是你要想,若是內存中有 100W 個 long,那就白白浪費了約 4MB 空間,不要小看這一點點的空間浪費,由於隨便一個跑着在線應用的 JVM 中,對象都能達到上千萬!
內存是節省出來的。
(2) 斟酌字段類型,在知足容量前提下,儘可能用小字段。
你知道一個 ArrayList 集合,若是裏面放了 10 個數字,佔用多少內存嗎?
讓咱們算算:
ArrayList 中有兩個字段:
/** * The array buffer into which the elements of the ArrayList are stored. * The capacity of the ArrayList is the length of this array buffer. */private transient Object[] elementData;/** * The size of the ArrayList (the number of elements it contains). * * @serial */private int size;複製代碼
Object Header 佔 4byte,Pointer 佔 4byte,一個 int 字段(size)佔 4byte,elementData 數組自己佔 12(4+4+4),數組中 10 個 Integer 對象佔 10×16。
因此整個集合空間大小爲 4+4+4+12+160=184byte。
若是咱們用 int[] 代替集合呢,12+4×10=52byte,對其後 56byte。
集合跟數組的比例是 184:56,超過 3:1 了!
(3) 若是可能,儘可能用數組,少用集合。
數組中是可使用基本類型的,可是集合中只能放包裝類型!
若是實在須要使用集合,推薦一個比較節約內存的集合工具, fastutil。
這裏麪包含了 JKD 集合中絕大部分的實現,並且比較省內存。
在上面的三個原則基礎上,提供兩個小技巧。
時間用 long/int 表示,不用 Date 或者 String。
短字符串若是能窮舉或者轉換成 ascii 表示,能夠用 long 或者 int 表示。
注意:小技巧跟具體的場景數據有關係,能夠根據實際狀況進行激進優化節省內存。
性能和可讀性向來就有些矛盾,在這裏也是,爲了節約內存,不得不進行取捨,代碼醜陋了一些,可讀性差了一些,還好能省下一些內存。
上面的原則在確實須要節約內存的時候 ,不妨能夠試試!
·END·
程序員的成長之路
路雖遠,行則必至
本文原發於 同名微信公衆號「程序員的成長之路」,回覆「1024」你懂得,給個讚唄。
回覆 [ 520 ] 領取程序員最佳學習方式
回覆 [ 256 ] 查看 Java 程序員成長規劃
往期精彩回顧