【面經】面試官:講講類的加載、連接和初始化?

寫在前面

在前幾年面試Java高級程序員的時候,只要是會一點JVM的基礎知識,基本就都可以面試經過了。最近幾年,對Java工程師的要求愈來愈嚴格,對於中級Java工程師來講,也須要掌握JVM相關的知識了。這不,一名讀者出去面試Java中級崗位,就被問及了JVM相關的類的加載、連接和初始化的問題。

概述

本文咱們一塊兒討論Java類的加載、連接和初始化。 Java字節代碼的表現形式是字節數組(byte[]),而Java類在JVM中的表現形式是 java.lang.Class類 的對象。一個Java類從字節代碼到可以在JVM中被使用,須要通過加載、連接和初始化這三個步驟。這三個步驟中,對開發人員直接可見的是Java類的加 載,經過使用Java類加載器(class loader)能夠在運行時刻動態的加載一個Java類;而連接和初始化則是在使用Java類以前會發生的動做。本文會詳細介紹Java類的加載、連接和 初始化的過程。java

Java 類的加載

Java類的加載是由類加載器來完成的。程序員

通常來講,類加載器分紅兩類:啓動類加載器(bootstrap)和用戶自定義的類加載器(user-defined)。面試

二者的區別在於啓動類加載器是由JVM的原生代碼實現的,而用戶自定義的類加載器都繼承自Java中的 java.lang.ClassLoader類。在用戶自定義類加載器的部分,通常JVM都會提供一些基本實現。應用程序的開發人員也能夠根據須要編寫本身的類加載器。 JVM中最常使用的是系統類加載器(system),它用來啓動 Java應用程序的加載。經過java.lang.ClassLoader的 getSystemClassLoader()方法能夠獲取到該類加載器對象。bootstrap

類加載器須要完成的最終功能是定義一個Java類,即把Java字節代碼轉換成JVM中的java.lang.Class類的對象。可是類加載的過程並非這麼簡單。 數組

Java類加載器有兩個比較重要的特徵:層次組織結構和代理模式。微信

層次組織結構指的是每一個類加載器都有一個父類加載器,經過 getParent()方法能夠獲取到。類加載器經過這種父親-後代的方式組織在一塊兒,造成樹狀層次結構。代理模式則指的是一個類加載器既能夠本身完成Java類的定義工做,也能夠代理給其它的類加載器來完成。因爲代理模式的存在,啓動一個類的加載過程的類加載器和最終定義這個類的類加載器可能並非一個。前者稱爲初始類加載器, 然後者稱爲定義類加載器。併發

二者的關聯在於:一個Java類的定義類加載器是該類所導入的其它Java類的初始類加載器。好比類A經過import導入了類 B,那麼由類A的定義類加載器負責啓動類B的加載過程。通常的類加載器在嘗試本身去加載某個Java類以前,會首先代理給其父類加載器。當父類加載器找不到的時候,纔會嘗試本身加載。這個邏輯是封裝在java.lang.ClassLoader類的 loadClass()方法中的。通常來講,父類優先的策略就足夠好了。在某些狀況下,可能須要採起相反的策略,即先嚐試本身加載,找不到的時候再代理給父類加載器。這種作法在Java的Web容器中比較常見,也是 Servlet規範推薦的作法。好比,Apache Tomcat爲每一個Web應用都提供一個獨立的類加載器,使用的就是本身優先加載的策略。 IBM WebSphere Application Server則容許Web應用選擇。分佈式

類加載器使用的策略

類加載器的一個重要用途是在JVM中爲相同名稱的Java類建立隔離空間。在JVM中,判斷兩個類是否相同,不只是根據該類的二進制名稱 ,還須要根據兩個類的定義類加載器。只有二者徹底同樣,才認爲兩個類是相同的。所以,即使是一樣的Java字節代碼,被兩個不一樣的類加載器定義以後,所獲得的Java類也是不一樣的。若是試圖在兩個類的對象之間進行賦值操做,會拋出 java.lang.ClassCastException。這個特性爲一樣名稱的Java類在JVM中共存創造了條件。在實際的應用中,可能會要求同一名稱的Java類的不一樣版本在JVM中能夠同時存在。經過類加載器就能夠知足這種需求。這種技術在 OSGi中獲得了普遍的應用微服務

Java 類的連接

Java類的連接指的是將Java類的二進制代碼合併到JVM的運行狀態之中的過程。在連接以前,這個類必須被成功加載。類的連接包括驗證、準備和解析等幾個步驟。驗證是用來確保Java類的二進制表示在結構上是徹底正確的。若是驗證過程出現錯誤的話,會拋出 java.lang.VerifyError錯誤。高併發

準備過程則是建立Java類中的靜態域,並將這些域的值設爲默認值。準備過程並不會執行代碼。在一個Java類中會包含對其它類或接口的形式引用,包括它的父類、所實現的接口、方法的形式參數和返回值的Java類等。解析的過程就是確保這些被引用的類能被正確的找到。解析的過程可能會致使其它的 Java類被加載。不一樣的 JVM 實現可能選擇不一樣的解析策略。

一種作法是在連接的時候,就遞歸的把全部依賴的形式引用都進行解析。而另外的作法則多是隻在一個形式引用真正須要的時候才進行解析。也就是說若是一個 Java 類只是被引用了,可是並無被真正用到,那麼這個類有可能就不會被解析。考慮下面的代碼:

public class LinkTest {
    public static void main(String[] args) {
        ToBeLinked toBeLinked = null;
        System.out.println("Test link.");
    }
}

類LinkTest 引用了類 ToBeLinked,可是並無真正使用它,只是聲明瞭一個變量,並無建立該類的實例或是訪問其中的靜態域。

在 Oracle 的 JDK 6 中,若是把編譯好的 ToBeLinked 的 Java 字節代碼刪除以後,再運行 LinkTest,程序不會拋出錯誤。這是由於 ToBeLinked 類沒有被真正用到,而 Oracle 的 JDK 6 所採用的連接策略使得ToBeLinked 類不會被加載,所以也不會發現 ToBeLinked 的 Java 字節代碼其實是不存在的。若是把代碼改爲 ToBeLinked toBeLinked = new ToBeLinked();以後,再按照相同的方法運行,就會拋出異常了。由於這個時候 ToBeLinked 這個類被真正使用到了,會須要加載這個類。

Java 類的初始化

當一個 Java 類第一次被真正使用到的時候,JVM 會進行該類的初始化操做。初始化過程的主要操做是執行靜態代碼塊和初始化靜態域。在一個類被初始化以前,它的直接父類也須要被初始化。可是,一個接口的初始化,不會引發其父接口的初始化。在初始化的時候,會按照源代碼中從上到下的順序依次執行靜態代碼塊和初始化靜態域。考慮下面的代碼:

public class StaticTest {
    public static int X = 10;
    public static void main(String[] args) {
        System.out.println(Y); //輸出60
    }
    static {
        X = 30;
    }
    public static int Y = X * 2;
}

在上面的代碼中,在初始化的時候,靜態域的初始化和靜態代碼塊的執行會從上到下依次執行。所以變量 X 的值首先初始化成 10,後來又被賦值成 30;而變量 Y 的值則被初始化成 60。

Java類和接口的初始化時機

Java 類和接口的初始化只有在特定的時機纔會發生,這些時機包括:

  • 建立一個 Java 類的實例。如
MyClass obj = new MyClass()
  • 調用一個 Java 類中的靜態方法。如
MyClass.sayHello()
  • 給 Java 類或接口中聲明的靜態域賦值。如
MyClass.value = 10
  • 訪問 Java 類或接口中聲明的靜態域,而且該域不是常值變量。如
int value = MyClass.value
  • 在頂層 Java 類中執行 assert 語句。
assert true;

經過 Java 反射 API 也可能形成類和接口的初始化。須要注意的是,當訪問一個 Java類或接口中的靜態域的時候,只有真正聲明這個域的類或接口才會被初始化。以下面的代碼所示。

package io.mykit.binghe.test;
 
class B {
    static int value = 100;
    static {
        System.out.println("Class B is initialized."); // 輸出
    }
}
 
class A extends B {
    static {
        System.out.println("Class A is initialized."); // 不會輸出
    }
}
 
public class InitTest {
    public static void main(String[] args) {
        System.out.println(A.value); // 輸出100
    }
}

在上述代碼中,類 InitTest 經過 A.value 引用了類 B 中聲明的靜態域 value。因爲 value是在類 B 中聲明的,只有類 B 會被初始化,而類 A 則不會被初始化。

建立本身的類加載器

在 Java 應用開發過程當中,可能會須要建立應用本身的類加載器。典型的場景包括實現特定的 Java 字節代碼查找方式、對字節代碼進行加密/解密以及實現同名 Java 類的隔離等 。建立 本身的 類加載 器並不 是 一件複雜 的事情 ,只須要繼承自java.lang.ClassLoader 類並覆寫對應的方法便可。 java.lang.ClassLoader 中提供的方法有很多,下面介紹幾個建立類加載器時須要考慮的:

  • defineClass():這個方法用來完成從Java字節代碼的字節數組到java.lang.Class的轉換。這個方法是不能被覆寫的,通常是用原生代碼來實現的。
  • findLoadedClass():這個方法用來根據名稱查找已經加載過的Java類。一個類加載器不會重複加載同一名稱的類。
  • findClass():這個方法用來根據名稱查找並加載Java類。
  • loadClass():這個方法用來根據名稱加載Java類。
  • resolveClass():這個方法用來連接一個Java類。

這裏比較 容易混淆的是 findClass()方法和 loadClass()方法的做用。前面提到過,在Java 類的連接過程當中,會須要對 Java 類進行解析,而解析可能會致使當前 Java 類所引用的其它 Java 類被加載。在這個時候,JVM 就是經過調用當前類的定義類加載器的 loadClass()方法來加載其它類的。 findClass()方法則是應用建立的類加載器的擴展點。應用本身的類加載器應該覆寫 findClass()方法來添加自定義的類加載邏輯。loadClass()方法的默認實現會負責調用 findClass()方法。前面提到,類加載器的代理模式默認使用的是父類優先的策略。這個策略的實現是封裝在 loadClass()方法中的。若是但願修改此策略,就須要覆寫 loadClass()方法。

下面的代碼給出了自定義的類加載的常見實現模式

public class MyClassLoader extends ClassLoader {
    protected Class<?> findClass(String name) throws ClassNotFoundException {
        byte[] b = null; //查找或生成Java類的字節代碼
        return defineClass(name, b, 0, b.length);
    }
}

好了,今天就到這兒吧,我是冰河,咱們下期見!!

重磅福利

微信搜一搜【冰河技術】微信公衆號,關注這個有深度的程序員,天天閱讀超硬核技術乾貨,公衆號內回覆【PDF】有我準備的一線大廠面試資料和我原創的超硬核PDF技術文檔,以及我爲你們精心準備的多套簡歷模板(不斷更新中),但願你們都能找到心儀的工做,學習是一條時而鬱鬱寡歡,時而開懷大笑的路,加油。若是你經過努力成功進入到了心儀的公司,必定不要懈怠放鬆,職場成長和新技術學習同樣,不進則退。若是有幸咱們江湖再見!

另外,我開源的各個PDF,後續我都會持續更新和維護,感謝你們長期以來對冰河的支持!!

寫在最後

若是你以爲冰河寫的還不錯,請微信搜索並關注「 冰河技術 」微信公衆號,跟冰河學習高併發、分佈式、微服務、大數據、互聯網和雲原生技術,「 冰河技術 」微信公衆號更新了大量技術專題,每一篇技術文章乾貨滿滿!很多讀者已經經過閱讀「 冰河技術 」微信公衆號文章,吊打面試官,成功跳槽到大廠;也有很多讀者實現了技術上的飛躍,成爲公司的技術骨幹!若是你也想像他們同樣提高本身的能力,實現技術能力的飛躍,進大廠,升職加薪,那就關注「 冰河技術 」微信公衆號吧,天天更新超硬核技術乾貨,讓你對如何提高技術能力再也不迷茫!

相關文章
相關標籤/搜索