JDK6和JDK7中的substring()方法

substring(int beginIndex, int endIndex)在JDK6與JDK7中的實現方式不同,理解他們的差別有助於更好的使用它們。爲了簡單起見,下面所說的substring()指的就是substring(int beginIndex, int endIndex)方法。html

1.substring()是作什麼的?java

substring(int beginIndex ,int endIndex)方法返回一個子字符串,返回的是從原字符串的beginIndex到endIndex-1之間的內容。數組

1
2
3
String x = "abcdef" ;
x = x.substring( 1 , 3 );
System.out.println(x);

輸出:性能

1
"bc"

2.當substring()被調用的時候,內部發生什麼事?this

你或許會認爲因爲x是不可變的對象,當x被x.substring(1,3)返回的結果賦值後,它將指向一個全新的字符串以下圖:spa

然而,這個圖並不徹底正確,或者說並無徹底表示出java 堆中真正發生的事情。那麼當調用substring()的時候到底發生的了什麼事呢?JDK 6與JDK7的substring方法實現有什麼不同呢?code

3.JDK6中的substring()htm

java中字符串是經過字符數組來支持實現的,在JDK6中,String類包含3個域,char[] value、int offset、int count。分別用於存儲真實的字符數組、數組的偏移量,以及String所包含的字符的個數。對象

當substring()方法被調用的時候,它會建立一個新的字符串對象,可是這個字符串的值在java 堆中仍然指向的是同一個數組,這兩個字符串的不一樣在於他們的count和offset的值。內存

下面是jdk6中的原代碼,是簡化後只包含用來講明這個問題的關鍵代碼:

1
2
3
4
5
6
7
8
9
10
11
//JDK 6
String( int offset, int count, char value[]) {
     this .value = value;
     this .offset = offset;
     this .count = count;
}
 
public String substring( int beginIndex, int endIndex) {
     //check boundary
     return  new String(offset + beginIndex, endIndex - beginIndex, value);
}

 

4.jdk6中substring()將會致使的問題

若是你有一個很是長的字符串,可是你僅僅只須要這個字符串的一小部分,這就會致使性能問題(譯註:可能會形成內存泄露,這個bug很早之前就有說起),由於你須要的只是很小的部分,而這個子字符串卻要包含整個字符數組,在jdk6中解決辦法就是使用下面的方法,它會指向一個真正的子字符串。

1
x = x.substring(x, y) + ""

5.JDK7中的substring()

在JDK7中有所改進,substring()方法在堆中真正的建立了一個新的數組,當原字符數組沒有被引用後就被GC回收了.所以避免了上述問題.

1
2
3
4
5
6
7
8
9
10
11
//JDK 7
public String( char value[], int offset, int count) {
     //check boundary
     this .value = Arrays.copyOfRange(value, offset, offset + count);
}
 
public String substring( int beginIndex, int endIndex) {
     //check boundary
     int subLen = endIndex - beginIndex;
     return new String(value, beginIndex, subLen);
}

 

譯註: 在最新的Oralce JDK 6u45中,substring的實現方式已經改進了,不過我查到openjdk的6-b14就是原來的實現方式,有興趣的能夠查查具體是哪一個版改進的.

相關文章
相關標籤/搜索