深刻理解多線程(二)—— Java的對象模型

上一篇文章中簡單介紹過synchronized關鍵字的方式,其中,同步代碼塊使用monitorentermonitorexit兩個指令實現,同步方法使用ACC_SYNCHRONIZED標記符實現。後面幾篇文章會從JVM源碼的角度更加深刻,層層剝開synchronized的面紗。html

在進入正題以前,確定有些基礎知識須要鋪墊,那麼先來看一下一個容易被忽略的可是又很重要的知識點 —— Java對象模型 。java

你們都知道的是,Java對象保存在堆內存中。在內存中,一個Java對象包含三部分:對象頭、實例數據和對齊填充。其中對象頭是一個很關鍵的部分,由於對象頭中包含鎖狀態標誌、線程持有的鎖等標誌。這篇文章就主要從Java對象模型入手,找一找咱們關係的對象頭以及對象頭中和鎖相關的運行時數據在JVM中是如何表示的。c++

Java的對象模型

任何一個接觸過Java的人都知道,Java是一種面嚮對象語言。在學習Java的過程當中你必定對下面兩句話不陌生:git

  • 一、在面向對象的軟件中,對象(Object)是某一個類(Class)的實例。 維基百科github

  • 二、一切皆對象 Thinking In Java數組

咱們還知道,在JVM的內存結構中,對象保存在堆內存中,而咱們在對對象進行操做時,其實操做的是對象的引用。那麼對象自己在JVM中的結構是什麼樣的呢?本文的全部分析均基於HotSpot虛擬機。緩存

oop-klass model

HotSpot是基於c++實現,而c++是一門面向對象的語言,自己是具有面向對象基本特徵的,因此Java中的對象表示,最簡單的作法是爲每一個Java類生成一個c++類與之對應。但HotSpot JVM並無這麼作,而是設計了一個OOP-Klass Model。OOP(Ordinary Object Pointer)指的是普通對象指針,而Klass用來描述對象實例的具體類型。數據結構

爲何HotSpot要設計一套oop-klass model呢?答案是:HotSopt JVM的設計者不想讓每一個對象中都含有一個vtable(虛函數表)多線程

這個解釋彷佛能夠說得通。衆所周知,C++和Java都是面向對象的語言,面嚮對象語言有一個很重要的特性就是多態。關於多態的實現,C++和Java有着本質的區別。框架

多態是面向對象的最主要的特性之一,是一種方法的動態綁定,實現運行時的類型決定對象的行爲。多態的表現形式是父類指針或引用指向子類對象,在這個指針上調用的方法使用子類的實現版本。多態是IOC、模板模式實現的關鍵。

在C++中經過虛函數表的方式實現多態,每一個包含虛函數的類都具備一個虛函數表(virtual table),在這個類對象的地址空間的最靠前的位置存有指向虛函數表的指針。在虛函數表中,按照聲明順序依次排列全部的虛函數。因爲C++在運行時並不維護類型信息,因此在編譯時直接在子類的虛函數表中將被子類重寫的方法替換掉。

在Java中,在運行時會維持類型信息以及類的繼承體系。每個類會在方法區中對應一個數據結構用於存放類的信息,能夠經過Class對象訪問這個數據結構。其中,類型信息具備superclass屬性指示了其超類,以及這個類對應的方法表(其中只包含這個類定義的方法,不包括從超類繼承來的)。而每個在堆上建立的對象,都具備一個指向方法區類型信息數據結構的指針,經過這個指針能夠肯定對象的類型。

上面這段是我從網上摘取過來的,說的有必定道理,可是也不全對。至於爲啥,我會在後文介紹到Klass的時候細說。

關於opp-klass模型的總體定義,在HotSpot的源碼中能夠找到。

oops模塊能夠分紅兩個相對獨立的部分:OOP框架和Klass框架。

oopsHierarchy.hpp裏定義了oop和klass各自的體系。

oop-klass結構

oops

oop體系:

//定義了oops共同基類
typedef class   oopDesc*                            oop;
//表示一個Java類型實例
typedef class   instanceOopDesc*            instanceOop;
//表示一個Java方法
typedef class   methodOopDesc*                    methodOop;
//表示一個Java方法中的不變信息
typedef class   constMethodOopDesc*            constMethodOop;
//記錄性能信息的數據結構
typedef class   methodDataOopDesc*            methodDataOop;
//定義了數組OOPS的抽象基類
typedef class   arrayOopDesc*                    arrayOop;
//表示持有一個OOPS數組
typedef class   objArrayOopDesc*            objArrayOop;
//表示容納基本類型的數組
typedef class   typeArrayOopDesc*            typeArrayOop;
//表示在Class文件中描述的常量池
typedef class   constantPoolOopDesc*            constantPoolOop;
//常量池告訴緩存
typedef class   constantPoolCacheOopDesc*   constantPoolCacheOop;
//描述一個與Java類對等的C++類
typedef class   klassOopDesc*                    klassOop;
//表示對象頭
typedef class   markOopDesc*                    markOop;
複製代碼

上面列出的是整個Oops模塊的組成結構,其中包含多個子模塊。每個子模塊對應一個類型,每個類型的OOP都表明一個在JVM內部使用的特定對象的類型。

從上面的代碼中能夠看到,有一個變量opp的類型是oppDesc ,OOPS類的共同基類型爲oopDesc

**在Java程序運行過程當中,每建立一個新的對象,在JVM內部就會相應地建立一個對應類型的OOP對象。**在HotSpot中,根據JVM內部使用的對象業務類型,具備多種oopDesc的子類。除了oppDesc類型外,opp體系中還有不少instanceOopDescarrayOopDesc 等類型的實例,他們都是oopDesc的子類。

OOP結構

這些OOPS在JVM內部有着不一樣的用途,例如**,instanceOopDesc表示類實例,arrayOopDesc表示數組。**也就是說,當咱們使用new建立一個Java對象實例的時候,JVM會建立一個instanceOopDesc對象來表示這個Java對象。同理,當咱們使用new建立一個Java數組實例的時候,JVM會建立一個arrayOopDesc對象來表示這個數組對象。

在HotSpot中,oopDesc類定義在oop.hpp中,instanceOopDesc定義在instanceOop.hpp中,arrayOopDesc定義在arrayOop.hpp中。

簡單看一下相關定義:

class oopDesc {
  friend class VMStructs;
  private:
      volatile markOop  _mark;
      union _metadata {
        wideKlassOop    _klass;
        narrowOop       _compressed_klass;
      } _metadata;

  private:
      // field addresses in oop
      void*     field_base(int offset)        const;

      jbyte*    byte_field_addr(int offset)   const;
      jchar*    char_field_addr(int offset)   const;
      jboolean* bool_field_addr(int offset)   const;
      jint*     int_field_addr(int offset)    const;
      jshort*   short_field_addr(int offset)  const;
      jlong*    long_field_addr(int offset)   const;
      jfloat*   float_field_addr(int offset)  const;
      jdouble*  double_field_addr(int offset) const;
      address*  address_field_addr(int offset) const;
}


class instanceOopDesc : public oopDesc {
}

class arrayOopDesc : public oopDesc {
}
複製代碼

經過上面的源碼能夠看到,instanceOopDesc實際上就是繼承了oopDesc,並無增長其餘的數據結構,也就是說instanceOopDesc中主要包含如下幾部分數據:markOop _markunion _metadata 以及一些不一樣類型的 field

HotSpot虛擬機中,對象在內存中存儲的佈局能夠分爲三塊區域:對象頭、實例數據和對齊填充。在虛擬機內部,一個Java對象對應一個instanceOopDesc的對象。其中對象頭包含了兩部份內容:_mark_metadata,而實例數據則保存在oopDesc中定義的各類field中。

_mark

文章開頭咱們就說過,之因此咱們要寫這篇文章,是由於對象頭中有和鎖相關的運行時數據,這些運行時數據是synchronized以及其餘類型的鎖實現的重要基礎,而關於鎖標記、GC分代等信息均保存在_mark中。由於本文主要介紹的oop-klass模型,在這裏暫時不對對象頭作展開,下一篇文章介紹。

_metadata

前面介紹到的_metadata是一個共用體,其中_klass是普通指針,_compressed_klass是壓縮類指針。在深刻介紹以前,就要來到oop-Klass中的另一個主角klass了。

klass

klass體系

//klassOop的一部分,用來描述語言層的類型
class  Klass;
//在虛擬機層面描述一個Java類
class   instanceKlass;
//專有instantKlass,表示java.lang.Class的Klass
class     instanceMirrorKlass;
//專有instantKlass,表示java.lang.ref.Reference的子類的Klass
class     instanceRefKlass;
//表示methodOop的Klass
class   methodKlass;
//表示constMethodOop的Klass
class   constMethodKlass;
//表示methodDataOop的Klass
class   methodDataKlass;
//最爲klass鏈的端點,klassKlass的Klass就是它自身
class   klassKlass;
//表示instanceKlass的Klass
class     instanceKlassKlass;
//表示arrayKlass的Klass
class     arrayKlassKlass;
//表示objArrayKlass的Klass
class       objArrayKlassKlass;
//表示typeArrayKlass的Klass
class       typeArrayKlassKlass;
//表示array類型的抽象基類
class   arrayKlass;
//表示objArrayOop的Klass
class     objArrayKlass;
//表示typeArrayOop的Klass
class     typeArrayKlass;
//表示constantPoolOop的Klass
class   constantPoolKlass;
//表示constantPoolCacheOop的Klass
class   constantPoolCacheKlass;
複製代碼

oopDesc是其餘oop類型的父類同樣,Klass類是其餘klass類型的父類。

klass

Klass向JVM提供兩個功能:

  • 實現語言層面的Java類(在Klass基類中已經實現)
  • 實現Java對象的分發功能(由Klass的子類提供虛函數實現)

文章開頭的時候說過:之因此設計oop-klass模型,是由於HotSopt JVM的設計者不想讓每一個對象中都含有一個虛函數表。

HotSopt JVM的設計者把對象一拆爲二,分爲klassoop,其中oop的職能主要在於表示對象的實例數據,因此其中不含有任何虛函數。而klass爲了實現虛函數多態,因此提供了虛函數表。因此,關於Java的多態,其實也有虛函數的影子在。

_metadata是一個共用體,其中_klass是普通指針,_compressed_klass是壓縮類指針。這兩個指針都指向instanceKlass對象,它用來描述對象的具體類型。

instanceKlass

JVM在運行時,須要一種用來標識Java內部類型的機制。在HotSpot中的解決方案是:爲每個已加載的Java類建立一個instanceKlass對象,用來在JVM層表示Java類。

來看下instanceKlass的內部結構:

//類擁有的方法列表
  objArrayOop     _methods;
  //描述方法順序
  typeArrayOop    _method_ordering;
  //實現的接口
  objArrayOop     _local_interfaces;
  //繼承的接口
  objArrayOop     _transitive_interfaces;
  //域
  typeArrayOop    _fields;
  //常量
  constantPoolOop _constants;
  //類加載器
  oop             _class_loader;
  //protected域
  oop             _protection_domain;
      ....
複製代碼

能夠看到,一個類該具備的東西,這裏面基本都包含了。

這裏還有個點須要簡單介紹一下。

在JVM中,對象在內存中的基本存在形式就是oop。那麼,對象所屬的類,在JVM中也是一種對象,所以它們實際上也會被組織成一種oop,即klassOop。一樣的,對於klassOop,也有對應的一個klass來描述,它就是klassKlass,也是klass的一個子類。klassKlass做爲oop的klass鏈的端點。關於對象和數組的klass鏈大體以下圖:

400_ac3_932

在這種設計下,JVM對內存的分配和回收,均可以採用統一的方式來管理。oop-klass-klassKlass關係如圖:

2579123-5b117a7c06e83d84

內存存儲

關於一個Java對象,他的存儲是怎樣的,通常不少人會回答:對象存儲在堆上。稍微好一點的人會回答:對象存儲在堆上,對象的引用存儲在棧上。今天,再給你一個更加顯得牛逼的回答:

對象的實例(instantOopDesc)保存在堆上,對象的元數據(instantKlass)保存在方法區,對象的引用保存在棧上。

其實若是細追究的話,上面這句話有點故意賣弄的意思。由於咱們都知道。方法區用於存儲虛擬機加載的類信息、常量、靜態變量、即時編譯器編譯後的代碼等數據。 所謂加載的類信息,其實不就是給每個被加載的類都建立了一個 instantKlass對象麼。

talk is cheap ,show me the code :

class Model
{
    public static int a = 1;
    public int b;

    public Model(int b) {
        this.b = b;
    }
}

public static void main(String[] args) {
    int c = 10;
    Model modelA = new Model(2);
    Model modelB = new Model(3);
}
複製代碼

存儲結構以下:

20170615230126453

從上圖中能夠看到,在方法區的instantKlass中有一個int a=1的數據存儲。在堆內存中的兩個對象的oop中,分別維護着int b=3,int b=2的實例數據。和oopDesc同樣,instantKlass也維護着一些fields,用來保存類中定義的類數據,好比int a=1

總結

每個Java類,在被JVM加載的時候,JVM會給這個類建立一個instanceKlass,保存在方法區,用來在JVM層表示該Java類。當咱們在Java代碼中,使用new建立一個對象的時候,JVM會建立一個instanceOopDesc對象,這個對象中包含了兩部分信息,對象頭以及元數據。對象頭中有一些運行時數據,其中就包括和多線程相關的鎖的信息。元數據其實維護的是指針,指向的是對象所屬的類的instanceKlass

we

參考資料

【理解HotSpot虛擬機】對象在jvm中的表示:OOP-Klass模型

Java反射: 從JDK到JVM全鏈路詳解

HotSpotVM 對象機制實現淺析#1

HotSpot實戰

相關文章
相關標籤/搜索