全面講解Hibernate緩存

時間 2019-11-07

原文原文鏈接

在向你們詳細介紹Hibernate二級緩存以前，首先讓你們瞭解下一級緩存，而後全面介紹Hibernate二級緩存。算法

Hibernate中提供了兩級Cache，第一級別的緩存是Session級別的緩存，它是屬於事務範圍的緩存。這一級別的緩存由hibernate管理的，通常狀況下無需進行干預；第二級別的緩存是SessionFactory級別的緩存，它是屬於進程範圍或羣集範圍的緩存。這一級別的緩存能夠進行配置和更改，而且能夠動態加載和卸載。 Hibernate還爲查詢結果提供了一個查詢緩存，它依賴於第二級緩存。數據庫

一. 一級緩存和二級緩存的比較：緩存

第一級緩存第二級緩存存放數據的形式相互關聯的持久化對象對象的散裝數據緩存的範圍事務範圍，併發

每一個事務都有單獨的第一級緩存進程範圍或集羣範圍，ide

緩存被同一個進程或集羣範圍內的全部事務共享併發訪問策略因爲每一個事務都擁有單獨的第一級緩存，性能

不會出現併發問題，無需提供併發訪問策略因爲多個事務會同時訪問第二級緩存中相同數據，hibernate

所以必須提供適當的併發訪問策略，來保證特定的事務隔離級別數據過時策略沒有提供數據插件

過時策略。處於一級緩存中的對象永遠不會過時，除非應用程序顯式清空緩存或者清除特定的對象必須提供數據過時策略，如基於內存的緩存中的對象的最大數目，容許對象處於緩存中的最長時間，以及容許對象處於緩存中的最長空閒時間物理存儲介質內存內存和硬盤。對象的散裝數據首先存放在基於內存的緩存中，當內存中對象的數目達到數據過時策略中指定上限時，就會把其他的對象寫入基於硬盤的緩存中。緩存的軟件實如今Hibernate的Session的實現中包含了緩存的實現由第三方提供，Hibernate僅提供了緩存適配器(CacheProvider)。用於把特定的緩存插件集成到Hibernate中。啓用緩存的方式只要應用程序經過Session接口來執行保存、更新、刪除、加載和查詢數據庫數據的操做，Hibernate就會啓用第一級緩存，把數據庫中的數據以對象的形式拷貝到緩存中，對於批量更新和批量刪除操做，若是不但願啓用第一級緩存，能夠繞過Hibernate API，直接經過JDBC　API來執行指操做。用戶能夠在單個類或類的單個集合的粒度上配置第二級緩存。對象

若是類的實例被常常讀但不多被修改，就能夠考慮使用第二級緩存。只有爲某個類或集合配置了第二級緩存，Hibernate在運行時纔會把它的實例加入到第二級緩存中。用戶管理緩存的方式第一級緩存的物理介質爲內存，因爲內存容量有限，必須經過恰當的檢索策略和檢索方式來限制加載對象的數目。Session的 evit()方法能夠顯式清空緩存中特定對象，但這種方法不值得推薦。第二級緩存的物理介質能夠是內存和硬盤，所以第二級緩存能夠存放大量的數據，數據過時策略的maxElementsInMemory屬性值能夠控制內存中的對象數目。管理第二級緩存主要包括兩個方面：選擇須要使用第二級緩存的持久類，設置合適的併發訪問策略：選擇緩存適配器，設置合適的數據過時策略。接口

二. 一級緩存的管理：

當應用程序調用Session的save()、update()、savaeOrUpdate()、get()或load()，以及調用查詢接口的 list()、iterate()或filter()方法時，若是在Session緩存中還不存在相應的對象，Hibernate就會把該對象加入到第一級緩存中。當清理緩存時，Hibernate會根據緩存中對象的狀態變化來同步更新數據庫。 Session爲應用程序提供了兩個管理緩存的方法： evict(Object obj)：從緩存中清除參數指定的持久化對象。 clear()：清空緩存中全部持久化對象。

三. Hibernate二級緩存的管理：

1. Hibernate二級緩存策略的通常過程以下：
1) 條件查詢的時候，老是發出一條select * from table_name where …. （選擇全部字段）這樣的SQL語句查詢數據庫，一次得到全部的數據對象。
2) 把得到的全部數據對象根據ID放入到第二級緩存中。
3) 當Hibernate根據ID訪問數據對象的時候，首先從Session一級緩存中查；查不到，若是配置了二級緩存，那麼從二級緩存中查；查不到，再查詢數據庫，把結果按照ID放入到緩存。
4) 刪除、更新、增長數據的時候，同時更新緩存。
Hibernate二級緩存策略，是針對於ID查詢的緩存策略，對於條件查詢則毫無做用。爲此，Hibernate提供了針對條件查詢的Query Cache。

2. 什麼樣的數據適合存放到第二級緩存中？
1) 不多被修改的數據
2) 不是很重要的數據，容許出現偶爾併發的數據
3) 不會被併發訪問的數據
4) 參考數據,指的是供應用參考的常量數據，它的實例數目有限，它的實例會被許多其餘類的實例引用，實例極少或者歷來不會被修改。

3. 不適合存放到第二級緩存的數據？
1) 常常被修改的數據
2) 財務數據，絕對不容許出現併發
3) 與其餘應用共享的數據。

4. 經常使用的緩存插件 Hibernater二級緩存是一個插件，下面是幾種經常使用的緩存插件：
◆EhCache：可做爲進程範圍的緩存，存放數據的物理介質能夠是內存或硬盤，對Hibernate的查詢緩存提供了支持。
◆OSCache：可做爲進程範圍的緩存，存放數據的物理介質能夠是內存或硬盤，提供了豐富的緩存數據過時策略，對Hibernate的查詢緩存提供了支持。
◆SwarmCache：可做爲羣集範圍內的緩存，但不支持Hibernate的查詢緩存。
◆JBossCache：可做爲羣集範圍內的緩存，支持事務型併發訪問策略，對Hibernate的查詢緩存提供了支持。

5. 配置Hibernate二級緩存的主要步驟：
1) 選擇須要使用二級緩存的持久化類，設置它的命名緩存的併發訪問策略。這是最值得認真考慮的步驟。
2) 選擇合適的緩存插件，而後編輯該插件的配置文件。

hibernate一級緩存和二級緩存的區別

緩存是介於應用程序和物理數據源之間，其做用是爲了下降應用程序對物理數據源訪問的頻次，從而提升了應用的運行性能。緩存內的數據是對物理數據源中的數據的複製，應用程序在運行時從緩存讀寫數據，在特定的時刻或事件會同步緩存和物理數據源的數據。

緩存的介質通常是內存，因此讀寫速度很快。但若是緩存中存放的數據量很是大時，也會用硬盤做爲緩存介質。緩存的實現不只僅要考慮存儲的介質，還要考慮到管理緩存的併發訪問和緩存數據的生命週期。

Hibernate的緩存包括Session的緩存和SessionFactory的緩存，其中SessionFactory的緩存又能夠分爲兩類：內置緩存和外置緩存。Session的緩存是內置的，不能被卸載，也被稱爲Hibernate的第一級緩存。SessionFactory的內置緩存和Session的緩存在實現方式上比較類似，前者是SessionFactory對象的一些集合屬性包含的數據，後者是指Session的一些集合屬性包含的數據。SessionFactory的內置緩存中存放了映射元數據和預約義SQL語句，映射元數據是映射文件中數據的拷貝，而預約義SQL語句是在Hibernate初始化階段根據映射元數據推導出來，SessionFactory的內置緩存是隻讀的，應用程序不能修改緩存中的映射元數據和預約義SQL語句，所以SessionFactory不須要進行內置緩存與映射文件的同步。SessionFactory的外置緩存是一個可配置的插件。在默認狀況下，SessionFactory不會啓用這個插件。外置緩存的數據是數據庫數據的拷貝，外置緩存的介質能夠是內存或者硬盤。SessionFactory的外置緩存也被稱爲Hibernate的第二級緩存。

Hibernate的這兩級緩存都位於持久化層，存放的都是數據庫數據的拷貝，那麼它們之間的區別是什麼呢？爲了理解兩者的區別，須要深刻理解持久化層的緩存的兩個特性：緩存的範圍和緩存的併發訪問策略。

持久化層的緩存的範圍

緩存的範圍決定了緩存的生命週期以及能夠被誰訪問。緩存的範圍分爲三類。

1 事務範圍：緩存只能被當前事務訪問。緩存的生命週期依賴於事務的生命週期，當事務結束時，緩存也就結束生命週期。在此範圍下，緩存的介質是內存。事務能夠是數據庫事務或者應用事務，每一個事務都有獨自的緩存，緩存內的數據一般採用相互關聯的的對象形式。

2 進程範圍：緩存被進程內的全部事務共享。這些事務有多是併發訪問緩存，所以必須對緩存採起必要的事務隔離機制。緩存的生命週期依賴於進程的生命週期，進程結束時，緩存也就結束了生命週期。進程範圍的緩存可能會存放大量的數據，因此存放的介質能夠是內存或硬盤。緩存內的數據既能夠是相互關聯的對象形式也能夠是對象的鬆散數據形式。鬆散的對象數據形式有點相似於對象的序列化數據，可是對象分解爲鬆散的算法比對象序列化的算法要求更快。

3 集羣範圍：在集羣環境中，緩存被一個機器或者多個機器的進程共享。緩存中的數據被複制到集羣環境中的每一個進程節點，進程間經過遠程通訊來保證緩存中的數據的一致性，緩存中的數據一般採用對象的鬆散數據形式。

對大多數應用來講，應該慎重地考慮是否須要使用集羣範圍的緩存，由於訪問的速度不必定會比直接訪問數據庫數據的速度快多少。

持久化層能夠提供多種範圍的緩存。若是在事務範圍的緩存中沒有查到相應的數據，還能夠到進程範圍或集羣範圍的緩存內查詢，若是仍是沒有查到，那麼只有到數據庫中查詢。事務範圍的緩存是持久化層的第一級緩存，一般它是必需的；進程範圍或集羣範圍的緩存是持久化層的第二級緩存，一般是可選的。

持久化層的緩存的併發訪問策略

當多個併發的事務同時訪問持久化層的緩存的相同數據時，會引發併發問題，必須採用必要的事務隔離措施。

在進程範圍或集羣範圍的緩存，即第二級緩存，會出現併發問題。所以能夠設定如下四種類型的併發訪問策略，每一種策略對應一種事務隔離級別。

事務型：僅僅在受管理環境中適用。它提供了Repeatable Read事務隔離級別。對於常常被讀但不多修改的數據，能夠採用這種隔離類型，由於它能夠防止髒讀和不可重複讀這類的併發問題。

讀寫型：提供了Read Committed事務隔離級別。僅僅在非集羣的環境中適用。對於常常被讀但不多修改的數據，能夠採用這種隔離類型，由於它能夠防止髒讀這類的併發問題。

非嚴格讀寫型：不保證緩存與數據庫中數據的一致性。若是存在兩個事務同時訪問緩存中相同數據的可能，必須爲該數據配置一個很短的數據過時時間，從而儘可能避免髒讀。對於極少被修改，而且容許偶爾髒讀的數據，能夠採用這種併發訪問策略。只讀型：對於歷來不會修改的數據，如參考數據，可使用這種併發訪問策略。

事務型併發訪問策略是事務隔離級別最高，只讀型的隔離級別最低。事務隔離級別越高，併發性能就越低。

什麼樣的數據適合存放到第二級緩存中？

一、不多被修改的數據

二、不是很重要的數據，容許出現偶爾併發的數據

三、不會被併發訪問的數據

四、參考數據

不適合存放到第二級緩存的數據？

一、常常被修改的數據

二、財務數據，絕對不容許出現併發

三、與其餘應用共享的數據。

Hibernate的二級緩存

如前所述，Hibernate提供了兩級緩存，第一級是Session的緩存。因爲Session對象的生命週期一般對應一個數據庫事務或者一個應用事務，所以它的緩存是事務範圍的緩存。第一級緩存是必需的，不容許並且事實上也沒法比卸除。在第一級緩存中，持久化類的每一個實例都具備惟一的OID。

第二級緩存是一個可插拔的的緩存插件，它是由SessionFactory負責管理。因爲SessionFactory對象的生命週期和應用程序的整個過程對應，所以第二級緩存是進程範圍或者集羣範圍的緩存。這個緩存中存放的對象的鬆散數據。第二級對象有可能出現併發問題，所以須要採用適當的併發訪問策略，該策略爲被緩存的數據提供了事務隔離級別。緩存適配器用於把具體的緩存實現軟件與Hibernate集成。第二級緩存是可選的，能夠在每一個類或每一個集合的粒度上配置第二級緩存。

Hibernate的二級緩存策略的通常過程以下：

1) 條件查詢的時候，老是發出一條select * from table_name where …. （選擇全部字段）這樣的SQL語句查詢數據庫，一次得到全部的數據對象。

2) 把得到的全部數據對象根據ID放入到第二級緩存中。

3) 當Hibernate根據ID訪問數據對象的時候，首先從Session一級緩存中查；查不到，若是配置了二級緩存，那麼從二級緩存中查；查不到，再查詢數據庫，把結果按照ID放入到緩存。

4) 刪除、更新、增長數據的時候，同時更新緩存。

Hibernate的二級緩存策略，是針對於ID查詢的緩存策略，對於條件查詢則毫無做用。爲此，Hibernate提供了針對條件查詢的Query緩存。

Hibernate的Query緩存策略的過程以下：

1) Hibernate首先根據這些信息組成一個Query Key，Query Key包括條件查詢的請求通常信息：SQL, SQL須要的參數，記錄範圍（起始位置rowStart，最大記錄個數maxRows)，等。

2) Hibernate根據這個Query Key到Query緩存中查找對應的結果列表。若是存在，那麼返回這個結果列表；若是不存在，查詢數據庫，獲取結果列表，把整個結果列表根據Query Key放入到Query緩存中。

3) Query Key中的SQL涉及到一些表名，若是這些表的任何數據發生修改、刪除、增長等操做，這些相關的Query Key都要從緩存中清空。