Class文件存儲的內容稱爲字節碼(ByteCode),包含了JVM指令集和符號表以及若干其餘輔助信息。html
class文件是一組以8位字節爲基礎單位的二進制流,各個數據項目嚴格按照順序緊湊的排列在Class文件中,中間沒有添加任何分隔符,整個Class文件中存儲的內容幾乎所有是程序運行的必要的數據,沒有空隙存在。java
當遇到8位字節以上的空間的數據項時,則會按照高位在前的方式分割成若干個8位字節進行存儲。web
Class文件中有兩種數據類型,分別是無符號數和表。shell
無符號數屬於基本的數據類型,以u一、u二、u四、u8來表示一個字節、兩個字節...的無符號數;無符號數用來描述數字、索引引用、數量值或UTF-8編碼構成的字符串值。bootstrap
表是由多個無符號數或其餘表做爲數據項構成的複合數據類型,通常以"_info"結尾,用來描述class文件的數據結構。數組
特色:節省存儲空間,提升處理性能bash
ClassFile {
u4 magic;
u2 minor_version;
u2 major_version;
u2 constant_pool_count;
cp_info constant_pool[constant_pool_count-1];
u2 access_flags;
u2 this_class;
u2 super_class;
u2 interfaces_count;
u2 interfaces[interfaces_count];
u2 fields_count;
field_info fields[fields_count];
u2 methods_count;
method_info methods[methods_count];
u2 attributes_count;
attribute_info attributes[attributes_count];
}
複製代碼
u2表示無符號數2個字節 u4表示無符號數4個字節數據結構
魔數的惟一做用是肯定這個文件是否爲一個能被虛擬機所接受的Class文件。魔數值固定爲0xCAFEBABE,不會改變。oracle
建立一個class文件 magic.class ,內容是magic test,直接運行java magic
操做:jvm
84407@FantJ MINGW64 ~/Desktop
$ java magictest
▒▒▒▒: ▒▒▒▒▒▒▒▒ magictest ʱ▒▒▒▒ LinkageError
java.lang.ClassFormatError: Incompatible magic value 1886741100 in class file magictest
複製代碼
報錯意思是:magic矛盾,而後給了個magic value的十進制數,那麼能夠識別的magic十進制應該是多少呢。
3405691582
那麼,而後我用javac編譯的正常java文件生成class文件,用binary viewer 查看:
魔數日後後面四位:表示字節碼版本,分別表示Class文件的副、主版本。當今用的最廣的幾個版本: jdk1.8:52 jdk1.7:51 jdk1.6:50
版本向下兼容
常量池計數器,值等於constant_pool表中的成員數加1,佔用兩個字節
Java虛擬機指令執行時依賴常量池(constant_pool)表中的符號信息。
全部的常量池項都具備以下通用格式:
cp_info {
u1 tag;
u1 info[];
}
複製代碼
info[]項的內容tag由的類型所決定。tag有效的類型和對應的取值在下表列出
常量類型 | 值 |
---|---|
CONSTANT_Class | 7 |
CONSTANT_Fieldref | 9 |
CONSTANT_Methodref | 10 |
CONSTANT_InterfaceMethodref | 11 |
CONSTANT_String | 8 |
CONSTANT_Integer | 3 |
CONSTANT_Float | 4 |
CONSTANT_Long | 5 |
CONSTANT_Double | 6 |
CONSTANT_NameAndType | 12 |
CONSTANT_Utf8 | 1 |
CONSTANT_MethodHandle | 15 |
CONSTANT_MethodType | 16 |
CONSTANT_InvokeDynamic | 18 |
表示類或接口
CONSTANT_Class_info {
u1 tag;
u2 name_index;
}
複製代碼
name_index
必須是對常量池的一個有效索引
字段:
CONSTANT_Fieldref_info {
u1 tag;
u2 class_index;
u2 name_and_type_index;
}
複製代碼
方法:
CONSTANT_Methodref_info {
u1 tag;
u2 class_index;
u2 name_and_type_index;
}
複製代碼
接口方法:
CONSTANT_InterfaceMethodref_info {
u1 tag;
u2 class_index;
u2 name_and_type_index;
}
複製代碼
class_index
必須是對常量池的有效索引,常量池在該索引處的項必須是CONSTANT_Class_info結構,表示一個類或接口,當前字段或方法是這個類或接口的成員。
CONSTANT_Methodref_info
結構的class_index
項的類型必須是類(不能是接口)。CONSTANT_InterfaceMethodref_info
結構的class_index
項的類型必須是接口(不能是類)。CONSTANT_Fieldref_info
結構的class_index
項的類型既能夠是類也能夠是接口。
name_and_type_index
必須是對常量池的有效索引,表示當前字段或方法的名字和描述符。 在一個CONSTANT_Fieldref_info
結構中,給定的描述符必須是字段
描述符。而CONSTANT_Methodref_info
和CONSTANT_InterfaceMethodref_info
中給定的描述符必須是方法
描述符。
用來表示String的結構
CONSTANT_String_info {
u1 tag;
u2 string_index;
}
複製代碼
string_index
必須是對常量池的有效索引,常量池在該索引處的項必須是CONSTANT_Utf8_info 結構,表示一組Unicode碼點序列,這組Unicode碼點序列最終會被初始化爲一個String對象。
表示4字節(int和float)的數值常量:
CONSTANT_Integer_info {
u1 tag;
u4 bytes;
}
CONSTANT_Float_info {
u1 tag;
u4 bytes;
}
複製代碼
表示8字節(long和double)的數值常量
CONSTANT_Long_info {
u1 tag;
u4 high_bytes;
u4 low_bytes;
}
CONSTANT_Double_info {
u1 tag;
u4 high_bytes;
u4 low_bytes;
}
複製代碼
表示字段或方法,可是和前面介紹的3個結構不一樣,CONSTANT_NameAndType_info結構沒有標識出它所屬的類或接口
CONSTANT_NameAndType_info {
u1 tag;
u2 name_index;
u2 descriptor_index;
}
複製代碼
name_index
項的值必須是對常量池的有效索引,常量池在該索引處的項必須是CONSTANT_Utf8_info結構,這個結構要麼表示特殊的方法名,要麼表示一個有效的字段或方法的非限定名(Unqualified Name)。
descriptor_index
項的值必須是對常量池的有效索引,常量池在該索引處的項必須是CONSTANT_Utf8_info結構,這個結構表示一個有效的字段描述符或方法描述符。
用於表示字符串常量的值
CONSTANT_Utf8_info {
u1 tag;
u2 length;
u1 bytes[length];
}
複製代碼
CONSTANT_Utf8_info結構中的內容是以length
屬性肯定長度的
表示方法句柄
CONSTANT_MethodHandle_info {
u1 tag;
u1 reference_kind;
u2 reference_index;
}
複製代碼
reference_kind
項的值必須在1至9之間(包括1和9),它決定了方法句柄的類型。
reference_kind
項的值爲1(REF_getField)、2(REF_getStatic)、3(REF_putField)或4(REF_putStatic)
,那麼常量池在reference_index索引處的項必須是CONSTANT_Fieldref_info結構,表示由一個字段建立的方法句柄。reference_kind
項的值是5(REF_invokeVirtual)、6(REF_invokeStatic)、7(REF_invokeSpecial)或8(REF_newInvokeSpecial)
,那麼常量池在reference_index
索引處的項必須是CONSTANT_Methodref_info
結構,表示由類的方法或構造函數建立的方法句柄。reference_kind
項的值是9(REF_invokeInterface)
,那麼常量池在reference_index索引處的項必須是CONSTANT_InterfaceMethodref_info結構,表示由接口方法建立的方法句柄。reference_kind
項的值是5(REF_invokeVirtual)、6(REF_invokeStatic)、7(REF_invokeSpecial)或9(REF_invokeInterface)
,那麼方法句柄對應的方法不能爲實例初始化()方法或類初始化方法()。reference_kind
項的值是8(REF_newInvokeSpecial)
,那麼方法句柄對應的方法必須爲實例初始化()方法。表示方法類型
CONSTANT_MethodType_info {
u1 tag;
u2 descriptor_index;
}
複製代碼
表示invokedynamic指令所使用到的引導方法(Bootstrap Method)、引導方法使用到動態調用名稱(Dynamic Invocation Name)、參數和請求返回類型、以及能夠選擇性的附加被稱爲靜態參數(Static Arguments)的常量序列。
CONSTANT_InvokeDynamic_info {
u1 tag;
u2 bootstrap_method_attr_index;
u2 name_and_type_index;
}
複製代碼
bootstrap_method_attr_index
項的值必須是對當前Class文件中引導方法表的bootstrap_methods[]
數組的有效索引。
name_and_type_index
項的值必須是對當前常量池的有效索引,常量池在該索引處的項必須是CONSTANT_NameAndType_info
結構,表示方法名和方法描述符。
訪問標誌,access_flags是一種掩碼標誌,用於表示某個類或者接口的訪問權限及基礎屬性。access_flags的取值範圍和相應含義見下表。
標記名 | 值 | 含義 |
---|---|---|
ACC_PUBLIC | 0x0001 | 能夠被包的類外訪問。 |
ACC_FINAL | 0x0010 | 不容許有子類。 |
ACC_SUPER | 0x0020 | 當用到invokespecial指令時,須要特殊處理的父類方法。 |
ACC_INTERFACE | 0x0200 | 標識定義的是接口而不是類。 |
ACC_ABSTRACT | 0x0400 | 不能被實例化。 |
ACC_SYNTHETIC | 0x1000 | 標識並不是Java源碼生成的代碼。 |
ACC_ANNOTATION | 0x2000 | 標識註解類型 |
ACC_ENUM | 0x4000 | 標識枚舉類型 |
this_class的值必須是對constant_pool表中項目的一個有效索引值。
是一個對constant_pool表中項目的一個有效索引值,表示指向常量池的第幾個位置。
表示這個Class文件所定義的類的直接父類,若是Class文件的super_class的值爲0,那這個Class文件只多是定義的是java.lang.Object類,只有它是惟一沒有父類的類
是一個對constant_pool表中項目的一個有效索引值,表示指向常量池的第幾個位置。
表示有這個類有幾個接口。
成員所表示的接口順序和對應的源代碼中給定的接口順序(從左至右)同樣,即interfaces[0]對應的是源代碼中最左邊的接口。
是一個對constant_pool表中項目的一個有效索引值,表示指向常量池的第幾個位置。
表示當前類或接口的直接父接口數量
表示當前Class文件fields[]數組的成員個數
每一個成員都必須是一個fields_info結構的數據項,描述當前類或接口聲明的全部字段,但不包括從父類或父接口繼承的部分。
用於表示當前類或接口中某個字段的完整描述
field_info {
u2 access_flags;
u2 name_index; //對常量池的一個有效索引
u2 descriptor_index; //對常量池的一個有效索引
u2 attributes_count; //當前字段的附加屬性的數量
attribute_info attributes[attributes_count];
}
複製代碼
access_flags
項的值是用於定義字段被訪問權限和基礎屬性的掩碼標誌。access_flags的取值範圍和相應含義見下表所示:
標記名 | 值 | 說明 |
---|---|---|
ACC_PUBLIC | 0x0001 | public,表示字段能夠從任何包訪問。 |
ACC_PRIVATE | 0x0002 | private,表示字段僅能該類自身調用。 |
ACC_PROTECTED | 0x0004 | protected,表示字段能夠被子類調用。 |
ACC_STATIC | 0x0008 | static,表示靜態字段。 |
ACC_FINAL | 0x0010 | final,表示字段定義後值沒法修改。 |
ACC_VOLATILE | 0x0040 | volatile,表示字段是易變的。 |
ACC_TRANSIENT | 0x0080 | transient,表示字段不會被序列化。 |
ACC_SYNTHETIC | 0x1000 | 表示字段由編譯器自動產生。 |
ACC_ENUM | 0x4000 | enum,表示字段爲枚舉類型。 |
attributes
表的每個成員的值必須是attribute結構
,一個字段能夠有任意個關聯屬性。
methods_count的值表示當前Class文件methods[]數組的成員個數,Methods[]數組中每一項都是一個method_info結構的數據項。
method_info結構能夠表示類和接口中定義的全部方法,包括實例方法、類方法、實例初始化方法方法和類或接口初始化方法方法。methods[]數組只描述當前類或接口中聲明的方法,不包括從父類或父接口繼承的方法。
methods[]數組中的每一個成員都必須是一個method_info結構的數據項,用於表示當前類或接口中某個方法的完整描述。
method_info {
u2 access_flags;
u2 name_index;
u2 descriptor_index;
u2 attributes_count;
attribute_info attributes[attributes_count];
}
複製代碼
access_flags
項的值是用於定義當前方法的訪問權限和基本屬性的掩碼標誌,access_flags的取值範圍和相應含義見下表所示。
標記名 | 值 | 說明 |
---|---|---|
ACC_PUBLIC | 0x0001 | public,方法能夠從包外訪問 |
ACC_PRIVATE | 0x0002 | private,方法只能本類中訪問 |
ACC_PROTECTED | 0x0004 | protected,方法在自身和子類能夠訪問 |
ACC_STATIC | 0x0008 | static,靜態方法 |
ACC_FINAL | 0x0010 | final,方法不能被重寫(覆蓋) |
ACC_SYNCHRONIZED | 0x0020 | synchronized,方法由管程同步 |
ACC_BRIDGE | 0x0040 | bridge,方法由編譯器產生 |
ACC_VARARGS | 0x0080 | 表示方法帶有變長參數 |
ACC_NATIVE | 0x0100 | native,方法引用非java語言的本地方法 |
ACC_ABSTRACT | 0x0400 | abstract,方法沒有具體實現 |
ACC_STRICT | 0x0800 | strictfp,方法使用FP-strict浮點格式 |
ACC_SYNTHETIC | 0x1000 | 方法在源文件中不出現,由編譯器產生 |
name_index
和 descriptor_index
兩屬性是對常量池的一個有效索引 attributes_count
的項的值表示這個方法的附加屬性的數量。 attributes
表的每個成員的值必須是attribute
結構,一個方法能夠有任意個與之相關的屬性。
attributes表中每一項都是一個attribute_info結構的數據項。
attributes_count的值表示當前Class文件attributes表的成員個數。
attributes表的每一個項的值必須是attribute_info結構,在Class文件格式中的ClassFile結構、field_info結構,method_info結構和Code_attribute結構都有使用,全部屬性的通用格式以下:
attribute_info {
u2 attribute_name_index;
u4 attribute_length;
u1 info[attribute_length];
}
複製代碼
attribute_name_index
必須是對當前Class文件的常量池的有效16位無符號索引。表示當前屬性的名字。
attribute_length
項的值給出了跟隨其後的字節的長度,這個長度不包括attribute_name_index
和attribute_name_index
項的6個字節。
ConstantValue屬性是定長屬性,位於field_info結構的屬性表中。若是該字段爲靜態類型(即field_info結構的access_flags項設置了ACC_STATIC標誌),則說明這個field_info結構表示的常量字段值將被分配爲它的ConstantValue屬性表示的值,這個過程也是類或接口申明的常量字段(Constant Field)初始化的一部分。這個過程發生在引用類或接口的類初始化方法執行以前。
ConstantValue_attribute {
u2 attribute_name_index;
u4 attribute_length;
u2 constantvalue_index;
}
複製代碼
attribute_name_index
項的值,必須是一個對常量池的有效索引。 attribute_length
項的值固定爲2。 constantvalue_index
項的值,必須是一個對常量池的有效索引。
Code屬性是一個變長屬性,位於method_info結構的屬性表。一個Code屬性只爲惟一一個方法、實例類初始化方法或類初始化方法保存Java虛擬機指令及相關輔助信息。全部Java虛擬機實現都必須可以識別Code屬性。若是方法被聲明爲native或者abstract類型,那麼對應的method_info結構不能有明確的Code屬性,其它狀況下,method_info有必須有明確的Code屬性。
Code_attribute {
u2 attribute_name_index;
u4 attribute_length;
u2 max_stack;
u2 max_locals;
u4 code_length;
u1 code[code_length];
u2 exception_table_length;
{ u2 start_pc;
u2 end_pc;
u2 handler_pc;
u2 catch_type;
} exception_table[exception_table_length];
u2 attributes_count;
attribute_info attributes[attributes_count];
}
複製代碼
attribute_name_index
項的值必須是對常量池的有效索引 attribute_length
項的值表示當前屬性的長度,不包括開始的6個字節。 max_stack
項的值給出了當前方法的操做數棧在運行執行的任什麼時候間點的最大深度。 max_locals
項的值給出了分配在當前方法引用的局部變量表中的局部變量個數,包括調用此方法時用於傳遞參數的局部變量。long和double型的局部變量的最大索引是max_locals-2,其它類型的局部變量的最大索引是max_locals-1. code_length
項給出了當前方法的code[]數組的字節數,code_length的值必須大於0,即code[]數組不能爲空。 code[]
數組給出了實現當前方法的Java虛擬機字節碼。 exception_table_length
項的值給出了exception_table[]
數組的成員個數量。 exception_table[]
數組的每一個成員表示code[]
數組中的一個異常處理器(Exception Handler)。exception_table[]
數組中,異常處理器順序是有意義的(不能隨意更改)。 start_pc
和end_pc
兩項的值代表了異常處理器在code[]數組中的有效範圍。 handler_pc
項表示一個異常處理器的起點 若是catch_type
項的值不爲0,那麼它必須是對常量池的一個有效索引 attributes_count
項的值給出了Code屬性中attributes表的成員個數。 屬性表的每一個成員的值必須是attribute結構。一個Code屬性能夠有任意數量的可選屬性與之關聯。
StackMapTable屬性是一個變長屬性,位於Code屬性的屬性表中。這個屬性會在虛擬機類加載的類型階段被使用。
StackMapTable_attribute {
u2 attribute_name_index;
u4 attribute_length;
u2 number_of_entries;
stack_map_frame entries[number_of_entries];
}
複製代碼
attribute_name_index
項的值必須是對常量池的有效索引 attribute_length
項的值表示當前屬性的長度,不包括開始的6個字節。 number_of_entries
項的值給出了entries
表中的成員數量。Entries表的每一個成員是都是一個stack_map_frame
結構的項。 entries
表給出了當前方法所需的stack_map_frame
結構。
...更多的屬性就不在這一一貼了,太多了,須要的時候查官方文檔便可:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-4.html#jvms-4.4
java虛擬機指令由一個字節長度的,表明某種特定操做含義的數字(稱之爲操做碼),以及隨後的表明此操做所需參數的操做數而構成。
操做碼的長度爲1個字節,因此最大隻有256條
指令參考:https://blog.csdn.net/web_code/article/details/12164733
public class Test {
public static void main(String[] args) {
int a = 10;
int b = 20;
int c = a+b;
System.out.println(c);
}
}
複製代碼
#2 = Fieldref #24.#25 // java/lang/System.out:Ljava/io/PrintStream;
#3 = Methodref #26.#27 // java/io/PrintStream.println:(I)V
public static void main(java.lang.String[]);
descriptor: ([Ljava/lang/String;)V
flags: (0x0009) ACC_PUBLIC, ACC_STATIC
Code:
stack=2, locals=4, args_size=1
0: bipush 10 //把10擴展成int入棧
2: istore_1 //將棧頂int類型值保存到局部變量1中
3: bipush 20 //把20擴展成int入棧
5: istore_2 //將棧頂int類型值保存到局部變量2中
6: iload_1 //從局部變量1中裝載int類型值入棧
7: iload_2 //從局部變量2中裝載int類型值入棧
8: iadd // 將棧頂兩int類型數相加,結果入棧。
9: istore_3 //將棧頂int類型值保存到局部變量3中
10: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream;獲取靜態字段的值。#2表示常量池的索引
13: iload_3
14: invokevirtual #3 // Method java/io/PrintStream.println:(I)V 運行時方法綁定調用方法。
17: return //void函數返回。
複製代碼