要說姿式,「+」號操做符必須是字符串拼接最經常使用的一種了,沒有之一。java
String chenmo = "沉默"; String wanger = "王二"; System.out.println(chenmo + wanger);
咱們把這段代碼使用 JAD 反編譯一下:apache
String chenmo = "\u6C89\u9ED8"; // 沉默 String wanger = "\u738B\u4E8C"; // 王二 System.out.println((new StringBuilder(String.valueOf(chenmo))).append(wanger).toString());
原來編譯的時候把「+」號操做符替換成了 StringBuilder 的 append 方法。也就是說,「+」號操做符在拼接字符串的時候只是一種形式主義,讓開發者使用起來比較簡便,代碼看起來比較簡潔,讀起來比較順暢。數組
除去「+」號操做符,StringBuilder 的 append 方法就是第二個經常使用的字符串拼接姿式了。安全
先來看一下 StringBuilder 類的 append 方法的源碼:app
public StringBuilder append(String str) { super.append(str); return this; }
這 3 行代碼沒啥可看的,可看的是父類 AbstractStringBuilder 的 append 方法:源碼分析
public AbstractStringBuilder append(String str) { if (str == null)return appendNull(); int len = str.length(); ensureCapacityInternal(count + len); str.getChars(0, len, value, count); count += len; return this; }
1)判斷拼接的字符串是否是 null,若是是,當作字符串「null」來處理。appendNull 方法的源碼以下:測試
private AbstractStringBuilder appendNull() { int c = count; ensureCapacityInternal(c + 4); final char[] value = this.value; value[c++] = 'n'; value[c++] = 'u'; value[c++] = 'l'; value[c++] = 'l'; count = c; return this; }
2)拼接後的字符數組長度是否超過當前值,若是超過,進行擴容並複製。ensureCapacityInternal 方法的源碼以下:ui
private void ensureCapacityInternal(int minimumCapacity) { // overflow-conscious code if (minimumCapacity - value.length > 0) { value = Arrays.copyOf(value, newCapacity(minimumCapacity)); } }
3)將拼接的字符串 str 複製到目標數組 value 中。this
str.getChars(0, len, value, count)
先有 StringBuffer 後有 StringBuilder,二者就像是孿生雙胞胎,該有的都有,只不過大哥 StringBuffer 由於多呼吸兩口新鮮空氣,因此是線程安全的。spa
public synchronized StringBuffer append(String str) { toStringCache = null; super.append(str); return this; }
StringBuffer 類的 append 方法比 StringBuilder 多了一個關鍵字 synchronized,可暫時忽略 toStringCache = null。
synchronized 是 Java 中的一個很是容易臉熟的關鍵字,是一種同步鎖。它修飾的方法被稱爲同步方法,是線程安全的。
單就姿式上來看,String 類的 concat 方法就好像 StringBuilder 類的 append:
String chenmo = "沉默"; String wanger = "王二"; System.out.println(chenmo.concat(wanger));
但假若有這樣兩行代碼:
chenmo += wanger;
chenmo = chenmo.concat(wanger);
它們之間究竟有多大的差異呢?
以前咱們已經瞭解到,chenmo += wanger 實際上至關於 (new StringBuilder(String.valueOf(chenmo))).append(wanger).toString()。
要探究「+」號操做符和 concat 之間的差異,實際上要看 append 方法和 concat 方法之間的差異。
append 方法的源碼以前分析過了。咱們就來看一下 concat 方法的源碼吧。
public String concat(String str) { int otherLen = str.length(); if (otherLen == 0) { return this; } int len = value.length; char buf[] = Arrays.copyOf(value, len + otherLen); str.getChars(buf, len); return new String(buf, true); }
1)若是拼接的字符串的長度爲 0,那麼返回拼接前的字符串。
if (otherLen == 0) { return this; }
2)將原字符串的字符數組 value 複製到變量 buf 數組中。
char buf[] = Arrays.copyOf(value, len + otherLen);
3)把拼接的字符串 str 複製到字符數組 buf 中,並返回新的字符串對象。
str.getChars(buf, len); return new String(buf, true);
經過源碼分析咱們大體能夠得出如下結論:
1)若是拼接的字符串是 null,concat 時候就會拋出 NullPointerException,「+」號操做符會當作是「null」字符串來處理。
2)若是拼接的字符串是一個空字符串(""),那麼 concat 的效率要更高一點。畢竟不須要 new StringBuilder 對象。
3)若是拼接的字符串很是多,concat 的效率就會降低,由於建立的字符串對象越多,開銷就越大。
注意了!!!
弱弱地問一下啊,還有在用 JSP 的同窗嗎?EL 表達式中是不容許使用「+」操做符來拼接字符串的,這時候就只能用 concat 了。
${chenmo.concat('-').concat(wanger)}
JDK 1.8 提供了一種新的字符串拼接姿式:String 類增長了一個靜態方法 join。
String chenmo = "沉默"; String wanger = "王二"; String cmower = String.join("", chenmo, wanger); System.out.println(cmower); //第一個參數爲字符串鏈接符,好比說: String message = String.join("-", "王二", "太特麼", "有趣了"); //輸出結果爲:王二-太特麼-有趣了
咱們來看一下 join 方法的源碼:
public static String join(CharSequence delimiter, CharSequence... elements) { Objects.requireNonNull(delimiter); Objects.requireNonNull(elements); // Number of elements not likely worth Arrays.stream overhead. StringJoiner joiner = new StringJoiner(delimiter); for (CharSequence cs: elements) { joiner.add(cs); } return joiner.toString(); }
發現了一個新類 StringJoiner,類名看起來很 6,讀起來也很順口。StringJoiner 是 java.util 包中的一個類,用於構造一個由分隔符從新鏈接的字符序列。限於篇幅,本文就再也不作過多介紹了,感興趣的同窗能夠去了解一下。
實戰項目當中,咱們處理字符串的時候,常常會用到這個類——org.apache.commons.lang3.StringUtils,該類的 join 方法是字符串拼接的一種新姿式。
String chenmo = "沉默"; String wanger = "王二"; StringUtils.join(chenmo, wanger);
該方法更善於拼接數組中的字符串,而且不用擔憂 NullPointerException。
StringUtils.join(null) = null StringUtils.join([]) = "" StringUtils.join([null]) = "" StringUtils.join(["a", "b", "c"]) = "abc" StringUtils.join([null, "", "a"]) = "a"
經過查看源碼咱們能夠發現,其內部使用的仍然是 StringBuilder。
public static String join(final Object[] array, String separator, final int startIndex, final int endIndex) { if (array == null) { return null; } if (separator == null) { separator = EMPTY; } final StringBuilder buf = new StringBuilder(noOfItems * 16); for (int i = startIndex; i < endIndex; i++) { if (i > startIndex) { buf.append(separator); } if (array[i] != null) { buf.append(array[i]); } } return buf.toString(); }
你們讀到這,不約而同會有這樣一種感受:沒想到啊沒想到,字符串拼接足足有 6 種姿式啊,晚上回到家必定要一一嘗試下。
我相信,小菜讀到我這篇文章的時候,他必定會明白爲何阿里巴巴不建議在 for 循環中使用」+」號操做符進行字符串拼接了。
來看兩段代碼。
第一段,for 循環中使用」+」號操做符。
String result = ""; for (int i = 0; i < 100000; i++) { result += "六六六"; }
第二段,for 循環中使用 append。
StringBuilder sb = new StringBuilder(); for (int i = 0; i < 100000; i++) { sb.append("六六六"); }
這兩段代碼分別會耗時多長時間呢?在個人 iMac 上測試出的結果是:
1)第一段代碼執行完的時間爲 6212 毫秒
2)第二段代碼執行完的時間爲 1 毫秒
差距也太特麼大了吧!爲何呢?
我相信有很多同窗已經有了本身的答案:第一段的 for 循環中建立了大量的 StringBuilder 對象,而第二段代碼至始至終只有一個 StringBuilder 對象。