Java 虛擬機的指令由一個字節長度的、表明着某種特定操做含義的操做碼(Opcode)以及跟隨其後的零至多個表明此操做所需參數的操做數(Operands)所構成。虛擬機中許多指令並不包含操做數,只有一個操做碼。 算法
若是忽略異常處理,那 Java 虛擬機的解釋器使用下面這個僞代碼的循環便可有效地工做: 數組
do { 安全
自動計算 PC 寄存器以及從 PC 寄存器的位置取出操做碼; ide
if (存在操做數) 取出操做數; 性能
執行操做碼所定義的操做 spa
} while (處理下一次循環); 線程
do { 設計 自動計算 PC 寄存器以及從 PC 寄存器的位置取出操做碼 ; code if ( 存在操做數 ) 取出操做數 ; orm 執行操做碼所定義的操做 } while ( 處理下一次循環 ) ; |
操做數的數量以及長度取決於操做碼,若是一個操做數的長度超過了一個字節,那它將會以 Big-Endian 順序存儲——即高位在前的字節序。舉個例子,若是要將一個 16 位長度的無符號整數使用兩個無符號字節存儲起來(將它們命名爲 byte1 和 byte2),那它們的值應該是這樣的:
(byte1 << 8) | byte2
( byte1 << 8 ) | byte2 |
字節碼指令流應當都是單字節對齊的,只有「tableswitch」和「lookupswitch」兩條指令例外,因爲它們的操做數比較特殊,都是以 4 字節爲界劃分開的,因此這兩條指令那個也須要預留出相應的空位來實現對齊。
限制 Java 虛擬機操做碼的長度爲一個字節,而且放棄了編譯後代碼的參數長度對齊,是爲了儘量地得到短小精幹的編譯代碼,即便這可能會讓 Java 虛擬機的具體實現付出必定的性能成本爲代價。因爲每一個操做碼只能有一個字節長度,因此直接限制了整個指令集的數量 (字節碼沒法超過 256 條的限制就來源於此) ,又因爲沒有假設數據是對齊好的,這就意味着虛擬機處理那些超過一個字節的數據的時候,不得不在運行時從字節中重建出具體數據的結構,這在某種程度上會損失一些性能。
在 Java 虛擬機的指令集中,大多數的指令都包含了其操做所對應的數據類型信息。舉個例子,iload 指令用於從局部變量表中加載 int 型的數據到操做數棧中,而 fload 指令加載的則是 float 類型的數據。這兩條指令的操做可能會是由同一段代碼來實現的,但它們必須擁有各自獨立的操做符。
對於大部分爲與數據類型相關的字節碼指令,他們的操做碼助記符中都有特殊的字符來代表專門爲哪一種數據類型服務:i 表明對 int 類型的數據操做,l 表明 long,s 表明 short,b 表明 byte,c 表明 char,f 表明 float,d 表明 double,a 表明 reference。也有一些指令的助記符中沒有明確的指明操做類型的字母,例如 arraylength 指令,它沒有表明數據類型的特殊字符,但操做數永遠只能是一個數組類型的對象。還有另一些指令,例如無條件跳轉指令 goto 則是與數據類型無關的。
因爲 Java 虛擬機的操做碼長度只有一個字節,因此包含了數據類型的操做碼對指令集的設計帶來了很大的壓力:若是每一種與數據類型相關的指令都支持 Java 虛擬機全部運行時數據類型的話,那恐怕就會超出一個字節所能表示的數量範圍了。所以,Java 虛擬機的指令集對於特定的操做只提供了有限的類型相關指令去支持它,換句話說,指令集將會故意被設計成非徹底獨立的(Not Orthogonal,即並不是每種數據類型和每一種操做都有對應的指令)。有一些單獨的指令能夠在必要的時候用來將一些不支持的類型轉換爲可被支持的類型。
下表列舉了 Java 虛擬機所支持的字節碼指令集,經過使用數據類型列所表明的特殊字符替換 opcode 列的指令模板中的 T,就能夠獲得一個具體的字節碼指令。若是在表中指令模板與數據類型兩列共同肯定的格爲空,則說明虛擬機不支持對這種數據類型執行這項操做。例如 load 指令有操做 int 類型的 iload,可是沒有操做 byte 類型的同類指令。
請注意,從下表中看來,大部分的指令都沒有支持整數類型 byte、char 和 short,甚至沒有任何指令支持 boolean 類型。編譯器會在編譯期或運行期會將 byte 和 short 類型的數據帶符號擴展(Sign-Extend)爲相應的 int 類型數據,將 boolean 和 char 類型數據零位擴展(Zero-Extend)爲相應的 int 類型數據。與之相似的,在處理 boolean、byte、short 和 char 類型的數組時,也會轉換爲使用對應的 int 類型的字節碼指令來處理。所以,大多數對於 boolean、byte、short 和 char 類型數據的操做,實際上都是使用相應的對 int 類型做爲運算類型(Computational Type)。
Java 虛擬機指令集所支持的數據類型:
opcode |
byte |
short |
int |
long |
float |
double |
char |
reference |
Tipush |
bipush |
sipush |
||||||
Tconst |
iconst |
lconst |
fconst |
dconst |
aconst |
|||
Tload |
iload |
lload |
fload |
dload |
aload |
|||
Tstore |
istore |
lstore |
fstore |
dstore |
astore |
|||
Tinc |
iinc |
|||||||
Taload |
baload |
saload |
iaload |
laload |
faload |
daload |
caload |
aaload |
Tastore |
bastore |
sastore |
iastore |
lastore |
fastore |
dastore |
castore |
aastore |
Tadd |
iadd |
ladd |
fadd |
dadd |
||||
Tsub |
isub |
lsub |
fsub |
dsub |
||||
Tmul |
imul |
lmul |
fmul |
dmul |
||||
Tdiv |
idiv |
ldiv |
fdiv |
ddiv |
||||
Trem |
irem |
lrem |
frem |
drem |
||||
Tneg |
ineg |
lneg |
fneg |
dneg |
||||
Tshl |
ishl |
lshl |
||||||
Tshr |
ishr |
lshr |
||||||
Tushr |
iushr |
lushr |
||||||
Tand |
iand |
land |
||||||
Tor |
ior |
lor |
||||||
Txor |
ixor |
lxor |
||||||
i2T |
i2b |
i2s |
i2l |
i2f |
i2d |
|||
l2T |
l2i |
l2f |
l2d |
|||||
f2T |
f2i |
f2l |
f2d |
|||||
d2T |
d2i |
d2l |
d2f |
|||||
Tcmp |
lcmp |
|||||||
Tcmpl |
fcmpl |
dcmpl |
||||||
Tcmpg |
fcmpg |
dcmpg |
||||||
if_TcmpOP |
if_icmpOP |
if_acmpOP |
||||||
Treturn |
ireturn |
lreturn |
freturn |
dreturn |
areturn |
在 Java 虛擬機中,實際類型與運算類型之間的映射關係,以下表所示:
實際類型 |
運算類型 |
分類 |
boolean |
int |
分類一 |
byte |
int |
分類一 |
char |
int |
分類一 |
short |
int |
分類一 |
int |
int |
分類一 |
float |
float |
分類一 |
reference |
reference |
分類一 |
returnAddress |
returnAddress |
分類一 |
long |
long |
分類二 |
double |
double |
分類二 |
有部分對操做棧進行操做的 Java 虛擬機指令(例如 pop 和 swap 指令)是與具體類型無關的,不過這些指令也必須受到運算類型分類的限制,這些分類也在表中列出了。
加載和存儲指令用於將數據從棧幀的局部變量表和操做數棧之間來回傳輸:
· 將一個局部變量加載到操做棧的指令包括有:iload、iload_<n>、lload、lload_<n>、fload、fload_<n>、dload、dload_<n>、aload、aload_<n>
· 將一個數值從操做數棧存儲到局部變量表的指令包括有:istore、istore_<n>、lstore、lstore_<n>、fstore、fstore_<n>、dstore、dstore_<n>、astore、astore_<n>
· 將一個常量加載到操做數棧的指令包括有:bipush、sipush、ldc、ldc_w、ldc2_w、aconst_null、iconst_m一、iconst_<i>、lconst_<l>、fconst_<f>、dconst_<d>
· 擴充局部變量表的訪問索引的指令:wide
訪問對象的字段或數組元素的指令也一樣會與操做數棧傳輸數據。
上面所列舉的指令助記符中,有一部分是以尖括號結尾的(例如 iload_<n>),這些指令助記符其實是表明了一組指令(例如 iload_<n>,它表明了 iload_0、iload_一、iload_2 和 iload_3 這幾條指令)。這幾組指令都是某個帶有一個操做數的通用指令(例如 iload)的特殊形式,對於這若干組特殊指令來講,它們表面上沒有操做數,不須要進行取操做數的動做,但操做數都是在指令中隱含的。除此以外,他們的語義與原生的通用指令徹底一致(例如 iload_0 的語義與操做數爲 0 時的 iload 指令語義徹底一致)。在尖括號之間的字母制定了指令隱含操做數的數據類型,<i>表明是 int 形數據,<l>表明 long 型,<f>表明 float 型,<d>表明 double型。在操做 byte、char 和 short 類型數據時,也用 int 類型表示。
這種指令表示方法,在整個《Java 虛擬機規範》之中都是通用的。
算術指令用於對兩個操做數棧上的值進行某種特定運算,並把結果從新存入到操做棧頂。大致上運算指令能夠分爲兩種:對整型數據進行運算的指令與對浮點型數據進行運算的指令,不管是那種算術指令,都是使用 Java 虛擬機的數字類型的。數據沒有直接支持 byte、short、char 和 boolean 類型(§2.11.1)的算術指令,對於這些數據的運算,都是使用操做 int 類型的指令。
整數與浮點數的算術指令在溢出和被零除的時候也有各自不一樣的行爲,全部的算術指令包括:
· 加法指令:iadd、ladd、fadd、dadd
· 減法指令:isub、lsub、fsub、dsub
· 乘法指令:imul、lmul、fmul、dmul
· 除法指令:idiv、ldiv、fdiv、ddiv
· 求餘指令:irem、lrem、frem、drem
· 取反指令:ineg、lneg、fneg、dneg
· 位移指令:ishl、ishr、iushr、lshl、lshr、lushr
· 按位或指令:ior、lor
· 按位與指令:iand、land
· 按位異或指令:ixor、lxor
· 局部變量自增指令:iinc
· 比較指令:dcmpg、dcmpl、fcmpg、fcmpl、lcmp
Java 虛擬機的指令集直接支持了在《Java 語言規範》中描述的各類對整數及浮點數操做的語義。
Java 虛擬機沒有明確規定整型數據溢出的狀況,可是規定了在處理整型數據時,只有除法指令(idiv 和 ldiv)以及求餘指令(irem 和 lrem)出現除數爲零時會致使虛擬機拋出異常,若是發生了這種狀況,虛擬機將會拋出 ArithmeitcException 異常。
Java 虛擬機在處理浮點數時,必須遵循 IEEE 754 規範中所規定行爲限制。也就是說 Java虛擬機要求徹底支持 IEEE 754 中定義的非正規浮點數值(Denormalized Floating-Point Numbers,§2.3.2)和逐級下溢(Gradual Underflow)。這些特徵將會使得某些數值算法處理起來變得更容易一些。
Java 虛擬機要求在進行浮點數運算時,全部的運算結果都必須舍入到適當的進度,非精確的結果必須舍入爲可被表示的最接近的精確值,若是有兩種可表示的形式與該值同樣接近,那將優先選擇最低有效位爲零的。這種舍入模式也是 IEEE 754 規範中的默認舍入模式,稱爲向最接近數舍入模式。
在把浮點數轉換爲整數時,Java 虛擬機使用 IEEE 754 標準中的向零舍入模式,這種模式的舍入結果會致使數字被截斷,全部小數部分的有效字節都會被丟棄掉。向零舍入模式將在目標數值類型中選擇一個最接近,可是不大於原值的數字來做爲最精確的舍入結果。
Java 虛擬機在處理浮點數運算時,不會拋出任何運行時異常(這裏所講的是 Java 的異常,請勿與 IEEE 754 規範中的浮點異常互相混淆),當一個操做產生溢出時,將會使用有符號的無窮大來表示,若是某個操做結果沒有明確的數學定義的話,將會時候 NaN 值來表示。全部使用 NaN 值做爲操做數的算術操做,結果都會返回 NaN。
在對 long 類型數值進行比較時,虛擬機採用帶符號的比較方式,而對浮點數值進行比較時(dcmpg、dcmpl、fcmpg、fcmpl),虛擬機採用 IEEE 754 規範說定義的無信號比較(Nonsignaling Comparisons)方式。
類型轉換指令能夠將兩種 Java 虛擬機數值類型進行相互轉換,這些轉換操做通常用於實現用戶代碼的顯式類型轉換操做,或者用來處理 Java 虛擬機字節碼指令集中指令非徹底獨立獨立的問題。
Java 虛擬機直接支持(注:「直接支持」意味着轉換時無需顯式的轉換指令)如下數值的寬化類型轉換(Widening Numeric Conversions,小範圍類型向大範圍類型的安全轉換):
· int 類型到 long、float 或者 double 類型
· long 類型到 float、double 類型
· float 類型到 double 類型
窄化類型轉換(Narrowing Numeric Conversions)指令包括有:i2b、i2c、i2s、l2i、f2i、f2l、d2i、d2l 和 d2f。窄化類型轉換可能會致使轉換結果產生不一樣的正負號、不一樣的數量級,轉換過程極可能會致使數值丟失精度。
在將 int 或 long 類型窄化轉換爲整數類型 T 的時候,轉換過程僅僅是簡單的丟棄除最低位 N 個字節之外的內容,N 是類型 T 的數據類型長度,這將可能致使轉換結果與輸入值有不一樣的正負號(注:在高位字節符號位被丟棄了)。
在將一個浮點值轉窄化轉換爲整數類型 T(T 限於 int 或 long 類型之一)的時候,將遵循如下轉換規則:
· 若是浮點值是 NaN,那轉換結果就是 int 或 long 類型的 0
· 不然,若是浮點值不是無窮大的話,浮點值使用 IEEE 754 的向零舍入模式(§2.8.1)
取整,得到整數值 v,這時候可能有兩種狀況:
· 若是 T 是 long 類型,而且轉換結果在 long 類型的表示範圍以內,那就轉換爲 long
類型數值 v
· 若是 T 是 int 類型,而且轉換結果在 int 類型的表示範圍以內,那就轉換爲 int
類型數值 v
· 不然:
· 若是轉換結果 v 的值過小(包括足夠小的負數以及負無窮大的狀況),沒法使用 T 類
型表示的話,那轉換結果取 int 或 long 類型所能表示的最小數字。
· 若是轉換結果 v 的值太大(包括足夠大的正數以及正無窮大的狀況),沒法使用 T 類
型表示的話,那轉換結果取 int 或 long 類型所能表示的最大數字。
從 double 類型到 float 類型作窄化轉換的過程與 IEEE 754 中定義的一致,經過 IEEE 754向最接近數舍入模式(§2.8.1)舍入獲得一個可使用 float 類型表示的數字。若是轉換結果的絕對值過小沒法使用 float 來表示的話,將返回 float 類型的正負零。若是轉換結果的絕對值太大沒法使用 float 來表示的話,將返回 float 類型的正負無窮大,對於 double 類型的 NaN 值將就規定轉換爲 float 類型的 NaN 值。
儘管可能發生上限溢出、下限溢出和精度丟失等狀況,可是 Java 虛擬機中數值類型的窄化轉換永遠不可能致使虛擬機拋出運行時異常(此處的異常是指《Java 虛擬機規範》中定義的異常,請讀者不要與 IEEE 754 中定義的浮點異常信號產生混淆)。
雖然類實例和數組都是對象,但 Java 虛擬機對類實例和數組的建立與操做使用了不一樣的字節碼指令:
· 建立類實例的指令:new
· 建立數組的指令:newarray,anewarray,multianewarray
· 訪問類字段(static 字段,或者稱爲類變量)和實例字段(非 static 字段,或者成爲實例變量)的指令:getfield、putfield、getstatic、putstatic
· 把一個數組元素加載到操做數棧的指令:baload、caload、saload、iaload、laload、faload、daload、aaload
· 將一個操做數棧的值儲存到數組元素中的指令:bastore、castore、sastore、iastore、fastore、dastore、aastore
· 取數組長度的指令:arraylength
· 檢查類實例類型的指令:instanceof、checkcas
Java 虛擬機提供了一些用於直接操做操做數棧的指令,包括:pop、pop二、dup、dup二、dup_x一、dup2_x一、dup_x二、dup2_x2 和 swap。
控制轉移指令可讓 Java 虛擬機有條件或無條件地從指定指令而不是控制轉移指令的下一條指令繼續執行程序。控制轉移指令包括有:
· 條件分支:ifeq、iflt、ifle、ifne、ifgt、ifge、ifnull、ifnonnull、if_icmpeq、if_icmpne、if_icmplt, if_icmpgt、if_icmple、if_icmpge、if_acmpeq 和 if_acmpne。
· 複合條件分支:tableswitch、lookupswitch
· 無條件分支:goto、goto_w、jsr、jsr_w、ret
在 Java 虛擬機中有專門的指令集用來處理 int 和 reference 類型的條件分支比較操做,爲了能夠無需明顯標識一個實體值是否 null,也有專門的指令用來檢測 null 值。
boolean 類型、byte 類型、char 類型和 short 類型的條件分支比較操做,都使用 int 類型的比較指令來完成,而對於 long 類型、float 類型和 double 類型的條件分支比較操做,則會先執行相應類型的比較運算指令,運算指令會返回一個整形值到操做數棧中,隨後再執行 int 類型的條件分支比較操做來完成整個分支跳轉。因爲各類類型的比較最終都會轉化爲 int 類型的比較操做,基於 int 類型比較的這種重要性,Java 虛擬機提供了很是豐富的 int類型的條件分支指令。
全部 int 類型的條件分支轉移指令進行的都是有符號的比較操做。
如下四條指令用於方法調用:
· invokevirtual 指令用於調用對象的實例方法,根據對象的實際類型進行分派(虛方法分派),這也是 Java 語言中最多見的方法分派方式。
· invokeinterface 指令用於調用接口方法,它會在運行時搜索一個實現了這個接口方法的對象,找出適合的方法進行調用。
· invokespecial 指令用於調用一些須要特殊處理的實例方法,包括實例初始化方法、私有方法和父類方法。
· invokestatic 指令用於調用類方法(static 方法)。
而方法返回指令則是根據返回值的類型區分的,包括有 ireturn(當返回值是 boolean、byte、char、short 和 int 類型時使用)、lreturn、freturn、dreturn 和 areturn,另外還有一條 return 指令供聲明爲 void 的方法、實例初始化方法、類和接口的類初始化方法使用。
在程序中顯式拋出異常的操做會由 athrow 指令實現,除了這種狀況,還有別的異常會在其它 Java 虛擬機指令檢測到異常情況時由虛擬機自動拋出。
Java 虛擬機能夠支持方法級的同步和方法內部一段指令序列的同步,這兩種同步結構都是使用管程(Monitor)來支持的。
方法級的同步是隱式,即無需經過字節碼指令來控制的,它實如今方法調用和返回操做之中。虛擬機能夠從方法常量池中的方法表結構(method_info Structure)中的 ACC_SYNCHRONIZED 訪問標誌區分一個方法是否同步方法。當方法調用時,調用指令將會檢查方法的 ACC_SYNCHRONIZED 訪問標誌是否被設置,若是設置了,執行線程將先持有管程,而後再執行方法,最後再方法完成(不管是正常完成仍是非正常完成)時釋放管程。在方法執行期間,執行線程持有了管程,其餘任何線程都沒法再得到同一個管程。若是一個同步方法執行期間拋出了異常,而且在方法內部沒法處理此異常,那這個同步方法所持有的管程將在異常拋到同步方法以外時自動釋放。
同步一段指令集序列一般是由 Java 語言中的 synchronized 塊來表示的,Java 虛擬機的指令集中有 monitorenter 和 monitorexit 兩條指令來支持 synchronized 關鍵字的語義,正確實現 synchronized 關鍵字須要編譯器與 Java 虛擬機二者協做支持。
結構化鎖定(Structured Locking)是指在方法調用期間每個管程退出都與前面的管程進入相匹配的情形。由於沒法保證全部提交給 Java 虛擬機執行的代碼都知足結構化鎖定,因此 Java 虛擬機容許(但不強制要求)經過如下兩條規則來保證結構化鎖定成立。假設 T 表明一條線程,M 表明一個管程的話:
1. T 在方法執行時持有管程 M 的次數必須與 T 在方法完成(包括正常和非正常完成)時釋放管程 M 的次數相等。
2. 找方法調用過程當中,任什麼時候刻都不會出現線程 T 釋放管程 M 的次數比 T 持有管程 M 次數多的狀況。
請注意,在同步方法調用時自動持有和釋放管程的過程也被認爲是在方法調用期間發生。