一:char的初始化java
char是Java中的保留字,與別的語言不一樣的是,char在Java中是16位的,由於Java用的是Unicode。不過8位的ASCII碼包含在Unicode中,是從0~127的。數組
Java中使用Unicode的緣由是,Java的Applet容許全世界範圍內運行,那它就須要一種能夠表述人類全部語言的字符編碼。 Unicode。可是English,Spanish,German, French根本不須要這麼表示,因此它們其實採用ASCII碼會更高效。這中間就存在一個權衡問題。編碼
由於char是16位的,採起的Unicode的編碼方式,因此char就有如下的初始化方式:spa
char c='c'; //字符,能夠是漢字,由於是Unicode編碼code
char c=十進制數,八進制數,十六進制數等等; //能夠用整數賦值utf-8
char c='\u數字'; //用字符的編碼值來初始化,如:char='\0',表示結束符,它的ascll碼是0,這句話的意思和 char c=0 是一個意思。unicode
二:關於char佔幾個字節的問題以下:get
1:「字節」是byte,「位」是bit ;it
2: 1 byte = 8 bit ;io
char 在java中是2個字節。java採用unicode,2個字節(16位)來表示一個字符。
例子代碼以下:
[java] 代碼
public class Test {
public static void main(String[] args) {
String str= "中";
char x ='中';
byte[] bytes=null;
byte[] bytes1=null;
try {
bytes = str.getBytes("utf-8");
bytes1 = charToByte(x);
} catch (UnsupportedEncodingException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
System.out.println("bytes 大小:"+bytes.length);
System.out.println("bytes1大小:"+bytes1.length);
}
public static byte[] charToByte(char c) {
byte[] b = new byte[2];
b[0] = (byte) ((c & 0xFF00) >> 8);
b[1] = (byte) (c & 0xFF);
return b;
}
}
運行結果:
bytes 大小:3
bytes1大小:2
java是用unicode來表示字符,"中"這個中文字符的unicode就是2個字節。
String.getBytes(encoding)方法是獲取指定編碼的byte數組表示,
一般gbk/gb2312是2個字節,utf-8是3個字節。
若是不指定encoding則取系統默認的encoding。