日拱一兵 | 原創html
原由是羣裏的一位童鞋忽然問了這麼問題:java
若是重寫 equals 不重寫 hashcode 會有什麼影響?
這個問題從上午10:45 開始陸續討論,到下午15:39 接近尾聲 (忽略這形同虛設的馬賽克)git
這是一個好問題,更是一個高頻基礎面試題,我還曾經專門寫過一篇文章 Java equals 和 hashCode 的這幾個問題能夠說明白嗎, 主要說明了如下內容程序員
<img src="https://rgyb.sunluomeng.top/20200728204424.png" style="zoom:50%;" />github
隨着討論的進行,問題慢慢集中在內存溢出和內存泄漏的問題上web
這兩個詞在中文解釋上有些類似,至少給個人第一感受,他們的差異是這樣的(有人和我同樣嗎?)面試
內存溢出:Out of Memory (OOM) ,這個你們都很熟悉了,理解起來也很簡單,就是內存不夠用了(啤酒【對象】太多,杯子【內存】裝不下了)數據庫
那啥是內存泄漏呢?
內存泄漏:Memory Leak編程
特地查了一下 Leak 的字典含義,解釋1的直白翻譯是【一般是因爲錯誤
或失誤
,從一個開口
進入
或逃脫】多線程
因此程序中的內存泄漏個人理解更可能是:因爲程序的編寫錯誤暴漏出一些 開口,致使一些對象進入這寫開口,最終致使相關問題,進一步說白了,程序有漏洞,不當的調用就會出問題
因此接下來咱們主要來看看 Java 內存泄漏,以及問題的原由 hashCode 和內存泄漏到底有哪些關係
咱也是一個有身份證的人,不能總講大白話,相對官方的內存泄漏解釋是這樣滴:
內存泄漏說明的是這樣一種狀況:堆中存在一些再也不使用的對象,但垃圾收集器沒法將它們從內存中刪除(垃圾收集器按期刪除未引用的對象,但從不收集仍在引用的對象),所以對它們進行了沒必要要的維護
這句話略顯抽象,一張圖你就能明白
若是有用的、但垃圾收集器又不能刪除的對象增多,就像下圖這樣,那麼就會逐漸致使內存溢出(OOM)了
因此也能夠總結爲,OOM 的緣由之一多是內存泄漏致使的
內存泄漏,會致使真正可用內存變少,在沒達到 OOM 的這個過程當中,就會出現奇奇怪怪的問題
因此也能夠反過來推理,若是發生上述問題,有可能程序的某些地方發生了內存泄漏
那常見的哪些情形可能會引發內存泄漏呢?又有哪些解決辦法呢?
直接來看一個例子
@Slf4j public class StaticTest { public static List<Double> list = new ArrayList<>(); public void populateList() { for (int i = 0; i < 10000000; i++) { list.add(Math.random()); } } public static void main(String[] args) { new StaticTest().populateList(); } }
populateList()
是一個 public 方法,可能被各類調用,致使 list 無限增大
解決辦法很簡單,針對這種情形(也就是一般所說的長週期對象引用短週期對象),就是將 list 放到方法內部,方法棧幀執行完自動就會被回收了
public void populateList() { List<Double> list = new ArrayList<>(); for (int i = 0; i < 10000000; i++) { list.add(Math.random()); } }
有童鞋可能有疑問:
看 Spring 源碼時有好可能是 static 修飾的成員變量,難道它們也會致使內存泄漏?
不是的,若是你仔細看邏輯,它們都是是在容器初始化的過程當中一次性加載的,因此不會像 populateList 隨着調用次數的增長,無限撐大 List
在學習流的時候老師就在耳邊反覆說:
必定要 關閉流... 閉流... 流... 㐬... 兒...
由於每當咱們創建一個新的鏈接或打開一個流時(好比數據庫鏈接、輸入流和會話對象),JVM都會爲這些資源分配內存,若是不關閉,這就是佔用空間"有用"的對象, GC 就不會回收他們,當請求很大,來個請求就新建一個流,最終都還沒關閉,結果可想而知
流的解決辦法很簡單,其實主要遵循相應範式就能夠避免此類問題
try-with-resources
, 這樣代碼在編譯後會自動幫你關閉流@Cleanup 註解
, 就像下面這樣@Cleanup InputStream jobJarInputStream = new URL(jobJarUrl).openStream(); @Cleanup OutputStream jobJarOutputStream = new FileOutputStream(jobJarFile); IOUtils.copy(jobJarInputStream, jobJarOutputStream);
又回到了這兩個函數上,有很大一部分程序員不會主動重寫 equals 和 hashCode,尤爲是用 Lombok @Data 註解(該註解默認會幫助重寫這兩個函數)後,更會忽視這兩個方法實現,一不當心的使就可能引發內存泄漏
來看個很是簡單的例子:
public class MemLeakTest { public static void main(String[] args) throws InterruptedException { Map<Person, String> map = new HashMap<>(); Person p1 = new Person("zhangsan", 1); Person p2 = new Person("zhangsan", 1); Person p3 = new Person("zhangsan", 1); map.put(p1, "zhangsan"); map.put(p2, "zhangsan"); map.put(p3, "zhangsan"); System.out.println(map.entrySet().size()); // 運行結果:3 } } @Getter @Setter class Person { private String name; private Integer id; public Person(String name, Integer id){ this.name = name; this.id = id; } }
Person 類沒有重寫 hashCode 方法,那 Map 的 put 方法就會調用 Object 默認的 hashCode 方法
public V put(K key, V value) { return putVal(hash(key), key, value, false, true); } static final int hash(Object key) { int h; return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); }
p1, p2, p3 在【業務】屬性上是徹底相同的三個對象,因爲「對象地址」的不一樣致使生成的 hashCode 不同,最終都被放到 Map 中,這就會致使業務重複對象佔用空間,因此這也是內存泄漏的一種
解決辦法很簡單,在 Person 上加一個 Lombok 的 @Data
註解自動幫你重寫 hashCode 方法,或手動在 IDE 中 generate,再次運行,結果就爲 1了,符合業務需求
那重寫了 hashCode 確實能夠避免重複對象的加入,那這就完事大吉了嗎, 再來看個例子
public static void main(String[] args) throws InterruptedException { // 注意: HashSet 的底層也是 Map 結構 Set<Person> set = new HashSet<Person>(); Person p1 = new Person("zhangsan", 1); Person p2 = new Person("lisi", 2); Person p3 = new Person("wanger", 3); set.add(p1); set.add(p2); set.add(p3); System.out.println(set.size()); // 運行結果:3 p3.setName("wangermao"); set.remove(p3); System.out.println(set.size()); // 運行結果:3 set.add(p3); System.out.println(set.size()); // 運行結果:4 }
從運行結果中來看,很顯然 set.remove(p3) 沒有刪除成功,由於 p3.setName("wangermao")
後,從新計算 p3 的 hashCode 會發生變化,因此 remove 的時候會找不到相應的 Node,這就又給了增長相同對象的「機會」,致使業務中無用的對象被引用着,因此能夠說這也是內存泄漏的一種。運行結果來看:
因此諸如此類操做,最好是先 remove,而後更改屬性,最後再從新 add 進去
看到這,你應該發現了,要解決 hashCode 相關的問題,你要充分了解集合的特性,更要留意類是否重寫了該方法以及它們的實現方式,避免出現內存泄漏狀況
羣消息中的最後,小姐姐 留下【ThreadLocal】幾個字,深藏功與名的離開了,一看就是高手
ThreadLocal 是面試多線程的高頻考點,它的好處是能夠快速方便的作到線程隔離,但你們也都知道他是一把雙刃劍,由於使用很差就有可能致使內存泄漏了
實際工做中咱們都是使用線程池來管理線程 「具體請參考 我會手動建立線程,爲何要使用線程池」,這種方式可讓線程獲得反覆利用(故意不讓 GC 回收),
如今,若是任何類建立了一個ThreadLocal變量,但沒有顯式地刪除它,那麼即便在web應用程序中止以後,該對象的副本仍將保留在工做線程中,從而阻止了該對象被垃圾收集,因此亂用也會致使內存泄漏
解決辦法依舊很簡單,依舊是遵循標準
remove()
方法,移除當前線程變量值try { threadLocal.set(System.nanoTime()); // business code } finally { threadLocal.remove(); }
我以爲小姐姐必定是高手
總的來講,引發內存泄漏的緣由很是多,好比還有引用外部類的內部類等問題,這裏再也不展開說明,只是說明了幾種很是常見的可能引起內存泄漏問題的幾種場景
內存泄漏問題不易察覺,因此有時須要藉助工具來幫忙
JVisualJvm 【可視化JVM】,可分析JDK1.6及其以上版本的JVM運行時的JVM參數、系統參數、堆棧、CPU使用等信息。可分析本地應用及遠程應用,在JDK1.6以上版本中自帶。工具的使用暫不展開說明, 想快速使用此工具,只須要在 IDE 中安裝個 VisualVM Launcher
插件
而後在進行基本的配置
而後在IDE的右上角或當前類鼠標右鍵就能夠點擊運行查看了
運行起 VisualJVM 就是這樣子了
不要走,還沒結束,在總結這篇文章的時候,我還發現了「新大陸」
腦海中的印象不知道爲什麼,很根深蒂固的接受了Object hashCode 是根據對象內存地址生成的,此次恰好想探求一下 hashCode 的本質,還着實打破了個人固有印象 (以 JDK1.8 爲例)
OpenJDK 定義 hashCode 的方法在下面兩個文件中
src/share/vm/prims/jvm.h
src/share/vm/prims/jvm.cpp
逐步看下去,最終會來到 get_next_hash 這個方法中,方便你們查看我先把方法截圖至此:
總的來講有 6 種生成 hashCode 的方式:
那在 JDK1.8 種用的哪種呢?
能夠看到在 JDK1.8 中生成 hashCode 的方式是 5, 也就是走程序的 else 路徑,即便用 Xorshift,並非以前認爲的對象內存地址「1」,覺得老版本是採用對象內存地址的方式,因此繼續查看其餘版本
從圖中能夠看出,JDK1.62 和 JDK1.73 版本生成 hashCode 的方式「1」隨機數的形式,和咱們本來認爲的並不同,別的版本沒有繼續查詢,至於「流傳下來」說是對象內存地址生成的 hashCode 我也木有再深刻研究,有了解的同窗還請留言賜教
那麼問題來了:
假設用的 JDK1.6或 JDK1.7,它們生成 hashCode 的方式是隨機生成的,那一個對象屢次調用hashCode是會有不一樣的hashCode 呢?(排除服務重啓的狀況)
顯然應該不會的,由於若是每次都變化, 存儲到集合中的對象那就很容易丟失了,那問題又來了:
它們存在哪了?
hash 值是存在對象頭中的,咱們還知道對象頭中還可能存儲線程ID,因此他們在某些情形中還會存在衝突
jvm 啓動時,可使用 -XX:+UseBiasedLocking=true
開啓偏向鎖,(關於偏向鎖,輕量級鎖,重量級鎖你們查閱 synchronized 相關文檔就能夠),這裏引 OpenJDK Wiki4 裏面的圖片加以文字說明整個衝突過程
因此,調用 Object 的 hashCode() 方法或者 System.identityHashCode() 方法會讓對象不能使用偏向鎖。到這裏你也就應該知道了,若是你還想使用偏向鎖,那最好重寫 hashCode() 方法,避免使偏向鎖失效
爲了解決羣的這個問題,發現新大陸的同時也差點讓我掉入【追問無底洞】,不過經過本文你應該瞭解內存溢出和內存泄漏的差異,以及他們的解決方案,另外 hashCode5 生成方式還着實讓人有些驚訝,若是你知道「hashCode的生成是根據對象內存地址生成的來源,還請留言賜教」。除此以外,小小的 hashCode 還有可能讓偏向鎖失效,全部的這些細節問題都有多是致使程序崩潰的坑,因此勿以「惡」小而爲之,毋以「善」小而不爲,良好的編程習慣能避免不少問題
固然想要更好的理解內存泄漏,固然是要更好的理解 GC 機制,而想要更好的理解 GC,固然是更好的理解 JVM,我們後續慢慢分析吧
ThreadLocal.remove()
方法,而是用 ThreadLocal.set(null)
會達到一樣的效果嗎?