substring(int beginIndex, int endIndex)在JDK6與JDK7中的實現方式不同,理解他們的差別有助於更好的使用它們。爲了簡單起見,下面所說的substring()指的就是substring(int beginIndex, int endIndex)方法。html
1.substring()是作什麼的?java
substring(int beginIndex ,int endIndex)方法返回一個子字符串,返回的是從原字符串的beginIndex到endIndex-1之間的內容。數組
1
2
3
|
String x =
"abcdef"
;
x = x.substring(
1
,
3
);
System.out.println(x);
|
輸出:性能
1
|
"bc"
|
2.當substring()被調用的時候,內部發生什麼事?this
你或許會認爲因爲x是不可變的對象,當x被x.substring(1,3)返回的結果賦值後,它將指向一個全新的字符串以下圖:spa
然而,這個圖並不徹底正確,或者說並無徹底表示出java 堆中真正發生的事情。那麼當調用substring()的時候到底發生的了什麼事呢?JDK 6與JDK7的substring方法實現有什麼不同呢?code
3.JDK6中的substring()htm
java中字符串是經過字符數組來支持實現的,在JDK6中,String類包含3個域,char[] value、int offset、int count。分別用於存儲真實的字符數組、數組的偏移量,以及String所包含的字符的個數。對象
當substring()方法被調用的時候,它會建立一個新的字符串對象,可是這個字符串的值在java 堆中仍然指向的是同一個數組,這兩個字符串的不一樣在於他們的count和offset的值。內存
下面是jdk6中的原代碼,是簡化後只包含用來講明這個問題的關鍵代碼:
1
2
3
4
5
6
7
8
9
10
11
|
//JDK 6
String(
int
offset,
int
count,
char
value[]) {
this
.value = value;
this
.offset = offset;
this
.count = count;
}
public
String substring(
int
beginIndex,
int
endIndex) {
//check boundary
return
new
String(offset + beginIndex, endIndex - beginIndex, value);
}
|
4.jdk6中substring()將會致使的問題
若是你有一個很是長的字符串,可是你僅僅只須要這個字符串的一小部分,這就會致使性能問題(譯註:可能會形成內存泄露,這個bug很早之前就有說起),由於你須要的只是很小的部分,而這個子字符串卻要包含整個字符數組,在jdk6中解決辦法就是使用下面的方法,它會指向一個真正的子字符串。
1
|
x = x.substring(x, y) +
""
|
5.JDK7中的substring()
在JDK7中有所改進,substring()方法在堆中真正的建立了一個新的數組,當原字符數組沒有被引用後就被GC回收了.所以避免了上述問題.
1
2
3
4
5
6
7
8
9
10
11
|
//JDK 7
public
String(
char
value[],
int
offset,
int
count) {
//check boundary
this
.value = Arrays.copyOfRange(value, offset, offset + count);
}
public
String substring(
int
beginIndex,
int
endIndex) {
//check boundary
int
subLen = endIndex - beginIndex;
return
new
String(value, beginIndex, subLen);
}
|
譯註: 在最新的Oralce JDK 6u45中,substring的實現方式已經改進了,不過我查到openjdk的6-b14就是原來的實現方式,有興趣的能夠查查具體是哪一個版改進的.